Wat te weten
- Typ in de Google Books Ngram Viewer een zin, kies een datumbereik en corpus, stel het afvlakkingsniveau in en klik op Zoeken in veel boeken.
- U kunt inzoomen op de gegevens. Om bijvoorbeeld te zoeken naar de werkwoordsvorm van vis, in plaats van het zelfstandig naamwoord vis, gebruikt u een tag: search for fish_VERB.
- Ngram Viewer geeft een grafiek weer die het gebruik van de frase door de tijd weergeeft. Voor meerdere zinnen wordt elk vertegenwoordigd door een kleurgecodeerde regel.
Dit artikel legt uit hoe u de Ngram Viewer-tool in Google Boeken kunt gebruiken om onderzoek uit te voeren en zoekopdrachten uit te voeren.
Hoe de Ngram Viewer werkt
Een Ngram, ook wel een N-gram genoemd, is een statistische analyse van tekst- of spraakinhoud om n (een getal) van een bepaald item in de tekst te vinden.
Het zoekitem kan van alles zijn, inclusief fonemen, voorvoegsels, zinsdelen en letters. Hoewel een Ngram buiten de onderzoeksgemeenschap onbekend is, wordt het op verschillende gebieden gebruikt en heeft het veel implicaties voor ontwikkelaars die computerprogramma's coderen die natuurlijke gesproken taal begrijpen en erop reageren.
In het geval van de Google Books Ngram Viewer is de te analyseren tekst afkomstig van het grote aantal boeken in het publieke domein dat Google heeft gescand om zijn Google Books-zoekmachine te vullen. Voor Google Books Ngram Viewer verwijst Google naar de tekst die u gaat doorzoeken als het corpus. De Ngram Viewer verzamelt per taal, hoewel u Brits en Amerikaans Engels afzonderlijk kunt analyseren of ze samen kunt voegen.
- Ga naar Google Books Ngram Viewer op books.google.com/ngrams.
-
Typ een zin of zinsdelen die u wilt analyseren. Scheid elke zin met een komma. Google suggereert "Albert Einstein, Sherlock Holmes, Frankenstein" om u op weg te helpen.
In NGram Viewer-zoekopdrachten zijn items hoofdlettergevoelig, in tegenstelling tot Google-zoekopdrachten op het web.
- Selecteer een datumbereik. De standaardwaarde is 1800 tot 2000.
- Kies een corpus. U kunt zoeken in teksten in een vreemde taal of in het Engels, en naast de standaardkeuzes ziet u mogelijk vermeldingen zoals "Engels (2009)" of "Amerikaans Engels (2009)" onderaan de lijst. Dit zijn oudere corpora die Google sindsdien heeft bijgewerkt, maar je hebt misschien een reden om je vergelijkingen te maken met oude datasets. De meeste gebruikers kunnen ze negeren en zich concentreren op de meest recente corpora.
-
Stel het afvlakkingsniveau in. Smoothing verwijst naar hoe vloeiend de grafiek aan het einde is. De meest nauwkeurige weergave geeft een afvlakkingsniveau van 0 weer, maar die instelling kan moeilijk te lezen zijn. De standaard is ingesteld op 3. In de meeste gevallen hoeft u dit niet aan te passen.
- Druk op Zoek in veel boeken.
Met Google's Ngram Viewer kunt u dieper in de gegevens duiken. Als u naar het werkwoord fish wilt zoeken in plaats van naar het zelfstandig naamwoord fish, kunt u dat doen met behulp van tags. In dit geval zoekt u naar fish_VERB.
Google biedt een volledige lijst met opdrachten en andere geavanceerde documentatie voor gebruik met Ngram Viewer op zijn website.
Bottom Line
Google Books Ngram Viewer geeft een grafiek weer die het gebruik van een bepaalde zin in boeken door de tijd weergeeft. Als u meer dan één woord of zin heeft ingevoerd, wordt elk woord weergegeven door een lijn met een kleurcode om te contrasteren met de andere zoektermen. Dit is vergelijkbaar met Google Trends, alleen de zoekopdracht bestrijkt een langere periode.
Casestudy
Beschouw de case study van azijntaarten. Ze worden genoemd in Laura Ingalls Wilder's Little House on the Prairie-serie. Onderzoek met Google's zoekopdracht op internet om meer te weten te komen over azijntaarten, onthult dat ze worden beschouwd als onderdeel van de Amerikaanse zuidelijke keuken en inderdaad met azijn zijn gemaakt. Ze luisteren terug naar tijden waarin niet iedereen het hele jaar door toegang had tot verse producten, maar is dat het hele verhaal?
Zoek in Google Ngram Viewer naar azijntaart, en je zult enkele vermeldingen van de taart tegenkomen in zowel de vroege als de late jaren 1800, veel vermeldingen in de jaren 40 en een toenemend aantal vermeldingen in de afgelopen tijd. Met een afvlakkingsniveau van 3 zie je echter een plateau over de vermeldingen in de 19e eeuw. Omdat er in die tijd niet veel boeken zijn gepubliceerd en omdat de gegevens op vloeiend zijn ingesteld, is het beeld vervormd. Waarschijnlijk werd in slechts één boek azijntaart genoemd, en het werd gemiddeld om een piek te voorkomen. Door de smoothing op 0 te zetten, kun je zien dat dit precies het geval is. De piek concentreert zich op 1869 en er is nog een piek in 1897 en 1900.
Het is onwaarschijnlijk dat niemand het de rest van de tijd over azijntaarten heeft gehad: er waren waarschijnlijk overal recepten te vinden, maar mensen schreven er niet over in boeken, en dat is een belangrijke beperking van Ngram-zoekopdrachten.