‘In het begin schiep God de hemel en de aarde.’ Tien woorden heeft het Nederlands nodig om dit te zeggen. Het Inuktitut, een taal uit Noord-Canada, heeft er maar vijf woorden voor nodig: ‘Pigiarnerme Gudib kilaglo nunalo pingortipak.’ Wat het Nederlands doet met woordjes als ‘in’, ‘het’, ‘de’ en ‘en’, doet het Inuktitut met uitgangen achter de vijf basiswoorden van de eerste zin van Genesis: ‘begin’, ‘God’, ‘hemel’, ‘aarde’, ‘scheppen’.
Maar er zijn ook talen die er duidelijk meer woorden dan het Nederlands voor nodig hebben. Bijvoorbeeld het Maori (Nieuw-Zeeland): ‘He mea hanga na te atua i te timatanga te rangi me te whenua.’ Veertien woorden. Letterlijk vertaald is dat zoiets als: ‘De ding maak van de God in de begin de hemel en de aarde.’ Het Maori doet niet aan uitgangen en ook niet aan werkwoordsvervoegingen. ‘Maak’ kan daarom in deze zin ‘gemaakt’ betekenen. En er is ook geen verschil tussen ‘de’ en ‘het’.
Talen kunnen grammaticaal behoorlijk van elkaar verschillen. Sinds vorig jaar is er een grote databank: Grambank. Daarin kunnen taalkundigen 195 grammaticale eigenschappen van 2.400 talen met elkaar vergelijken. Zo kunnen ze een aantal vermoedens over wat er grammaticaal wel en niet mogelijk is in menselijke taal voor het eerst op grote schaal onderzoeken. Zoals: hebben talen die door kleine hechte gemeenschappen gesproken worden, complexere grammatica’s? In hoeverre hangt binnen de grammatica van talen alles met elkaar samen? En: zal een groot deel van de grammaticale diversiteit binnen een paar generaties verloren gaan?
Een verzameling van 2.400 talen, dat is ruwweg een derde van alle talen die er zijn. En die 195 grammaticale eigenschappen, dat zijn voornamelijk vragen die met ja of nee beantwoord kunnen worden. Heeft het zelfstandig naamwoord een aparte vorm voor het meervoud? Heeft het werkwoord een aparte vorm voor de verleden tijd? Voor het Nederlands is het antwoord in beide gevallen: ja. Voor veel andere talen is het antwoord: nee. Daarin hoef je, als dat vanuit de context al duidelijk is, niet per se aan te geven dat iets enkelvoud of meervoud is.
En veel talen hebben genoeg aan een klein bijwoordje om aan te geven dat iets in het verleden gebeurde. In een enkel geval gaat het in Grambank om vragen waarop drie of vier antwoorden mogelijk zijn. Die 195 vragen beslaan de belangrijkste aspecten van de grammatica van talen. Dat gaat over woordvolgorde. Over uitgangen die achter woorden geplakt worden, en over voorvoegsels die dezelfde functie hebben als uitgangen maar vóór woorden worden geplakt. En het gaat over wat je in zo’n taal verplicht moet uitdrukken. Dat iets enkelvoud of meervoud is? Dat het er twee zijn (‘tweevoud’)? Heb je één verleden tijd, of heb je er twee: een voor het nabije verleden en een voor het verre verleden?
En het gaat ook over dingen waar je je als Nederlandstalige niet eens zo veel bij kunt voorstellen. Kun je een bewering ontkennen door middel van een hulpwerkwoord? Kun je de stam van het werkwoord verdubbelen? In sommige talen kan dat. „Het was veel werk om Grambank samen te stellen”, zegt Hedvig Skirgård van het Max Planck Instituut voor Evolutionaire Antropologie in Leipzig, dat dit project samen met collega’s in Nijmegen heeft ontwikkeld. „Vijftig mensen hebben hieraan gewerkt. Ze hebben vragenlijsten ingevuld met behulp van de grammaticale beschrijvingen die er zijn. In totaal was dat meer dan twintigduizend uur werk, schat ik.”
En er komen nog steeds talen bij. Want wereldwijd zijn er nu zo’n 3.500 talen grammaticaal beschreven. „Ongeveer de helft van alle talen”, zegt Skirgård. Voor elk van die talen levert dit een code op van 195 cijfers. Is het antwoord op een vraag nee, dan krijg je in die code een nul. Bij ja: een één. Bij een paar vragen, waar drie of vier antwoorden mogelijk zijn, krijg je een één, twee, drie of vier. Die codes van 195 cijfers, daar kan de computer vervolgens heerlijk mee aan de slag. Dat kan op allerlei manieren met elkaar vergeleken worden. Waarbij dankbaar gebruikt wordt gemaakt van de statistische methodes uit de evolutionaire biologie, die ontwikkeld zijn voor het vergelijken van dna-codes. Hieronder volgen vijf vragen waar Grambank (misschien) een antwoord op kan geven.
1Welke taal staat grammaticaal het verst af van het Nederlands?
„Dat zal wel een taal uit Nieuw-Guinea of Amerika zijn”, voorspelt Hedvig Skirgård. En ja hoor, een dag later heeft ze het uitgezocht: een taal uit Nieuw-Guinea, met 15.000 sprekers: het Sinaugoro. Leg je daar het Nederlands naast, dan verschilt 49 procent van de 195 geboekstaafde grammaticale eigenschappen. De helft dus.
Het Sinaugoro is een taal waarin het werkwoord zowel uitgangen als voorvoegsels krijgt en dus veel informatie kan bevatten. ‘Ik kan jou helpen’ zeg je in die taal met drie woorden: ‘ik’ plus ‘helpen’ plus ‘mogelijk’. Maar het werkwoord, ‘helpen’, is in die zin behoorlijk ingewikkeld: je neemt het zelfstandig naamwoord ‘help”, zet er een voorvoegsel voor waarmee het een werkwoord wordt, en je plakt er vervolgens nog twee voorvoegsels én twee uitgangen aan vast, die achtereenvolgens aangeven dat het een toestand is (‘kunnen helpen’) die al in het verleden begonnen is, dat ‘ik’ het onderwerp is, en ‘jij’ het lijdend voorwerp, en dat het een toestand is die voortduurt. Rondom het centrale elementje ‘kava’ (‘help’) wordt zo dit ingewikkelde woord opgebouwd: ‘bavagakavamuni‘ (b-a-vaga-kava-mu-ni).
Bedreigde talen vertegenwoordigen een onevenredig groot deel van de grammaticale diversiteit
Het Sinaugoro heeft geen voorzetsels, maar achterzetsels. Naast enkelvoud en meervoud kent het een tweevoud. Als je wilt zeggen dat A groter is dan B zeg je: ‘B is klein, A is groot.’ En als je in een mythologisch verhaal de zin ‘Hij werd een vogel” nodig hebt, pak je het woord ‘vogel’ en plak je daar een werkwoordsuitgang achter: ‘Hij vogelde.’ En zo zijn er nog veel meer dingen die het Sinaugoro helemaal anders doet dan het Nederlands.
2Waar op aarde is de grammaticale diversiteit het grootst?
De analyses van Grambank bevestigen wat men al dacht te weten. Vooral in Noord-, Midden- en Zuid-Amerika en in Nieuw-Guinea is de grammaticale variatie erg groot. En dan gaat het om talen die maar weinig sprekers hebben (een paar duizend, een paar honderd) en die flink bedreigd worden in hun voortbestaan.
„Bedreigde talen vertegenwoordigen een onevenredig groot deel van de grammaticale diversiteit”, zegt Skirgård en ze legt uit waarom het jammer zou zijn als dat binnen twee, drie generaties allemaal zou verdwijnen. „Allereerst is dit natuurlijk verwoestend voor de gemeenschappen zelf. Maar voor de wetenschap is het ook vervelend. Als daarmee een groot deel van de grammaticale diversiteit verdwijnt, dan wordt het erg moeilijk om precies vast te stellen wat de mogelijkheden en grenzen zijn van menselijke taal. Wat we als taalkundigen onder elkaar de design space van taal noemen. Daar zullen we dan misschien nooit achter kunnen komen.
3Wat zijn de meest ongewone talen?
De computer heeft ook berekend wat de meest ‘ongewone’ talen zijn. Dat zijn – niet heel verrassend – vooral ‘isolaten’: talen die geen verwanten hebben, en dus niet bij een taalfamilie horen. Al hebben ze in het verleden ongetwijfeld wel broertjes en zusjes gehad, maar die zijn al allemaal uitgestorven.
Een voorbeeld van zo’n ongewone taal zonder aanwijsbare verwanten is het Yele, dat gesproken wordt op Rossel Island, een afgelegen eilandje ten oosten van Nieuw-Guinea. Deze taal zit vol grillige onregelmatigheden. Bovendien hebben de meeste werkwoorden in deze taal twee of drie verschillende stammen. In het Nederlands blijft de werkwoordstam in principe gelijk: werk-en, werk-te, ge-werk-t. In het Yele dus niet. ‘Eten’ heeft in de tegenwoordige tijd de stam ‘ma’. En in de verleden tijd zijn er twee mogelijkheden: ‘pipi’, als je ‘aan het eten’ was, en ntii als je ‘at’. Ook bij de zelfstandige naamwoorden komt dit nogal eens voor. Het woord voor ‘hand’ is, afhankelijk van welk bezittelijk voornaamwoord (mijn, jouw, haar) eraan voorafgaat: kee, ngee of koo.
4Hebben kleine hechte taalgemeenschappen talen met complexere grammatica’s?
Al langer leeft onder taalkundigen deze intrigerende gedachte: dat het voor de grammatica van een taal uitmaakt of die taal een paar honderd of een paar duizend sprekers heeft, of een paar miljoen.
Het bewijs daarvoor was tot nu toe erg anekdotisch. Veldonderzoekers die ergens een taal van een kleine, geïsoleerd levende gemeenschap in kaart brachten, waren vaak verbaasd over wat er allemaal in zo’n taal kan en moet worden uitgedrukt. Bijvoorbeeld, dat je aan de vorm van het werkwoord kunt zien of wat er gezegd wordt door degene die dat zegt zelf gezien is, of dat die persoon dat alleen maar van horen zeggen heeft.
In talen zonder naamvallen is de woordvolgorde heel rigide
Ook kwamen ze heel complexe systemen tegen van ‘woordklassen’ voor zelfstandige naamwoorden. Waar het Nederlands twee woordklassen heeft (de-woorden en het-woorden), zijn er talen die er meer dan tien hebben. Aparte klassen voor (bijvoorbeeld) mensen, dieren, planten, voedsel, ronde voorwerpen, langwerpige voorwerpen, onzichtbare dingen etc. En elke woordklasse heeft dan zijn eigen grammaticale eigenschappen.
Anderzijds zou het ook zo zijn dat talen die wel heel veel sprekers hebben (honderdduizenden, miljoenen), een minder complexe grammatica vaak zouden hebben, omdat ze overgangsperioden hebben gekend waarin zo’n taal gesproken werd door mensen voor wie het niet de moedertaal was. Die hebben de neiging om de grammatica te vereenvoudigen.
Een bekend voorbeeld daarvan is het Afrikaans, dat afstamt van het Nederlands, maar geen verschil meer kent tussen de en het. Het is in het Afrikaans allemaal: die. Ook kent het Afrikaans geen verschil tussen bijvoorbeeld drink, drinkt en drinken. Het is allemaal: drink.
Aan de hand van Grambank is nu onderzocht in hoeverre grammaticale complexiteit samenhangt met dingen als: hoeveel sprekers heeft zo’n taal, hoeveel niet-moedertaalsprekers zijn er, is de taal officieel erkend? Daar kwam vooralsnog niks uit. Er werd geen verband gevonden. Maar het laatste woord is hier nog niet over gezegd. Want grammaticale complexiteit is een lastig concept, dat je op verschillende manieren kunt modelleren.
5Welke dingen in een grammatica hangen met elkaar samen?
Van sommige dingen in de grammatica van een taal wordt vaak aangenomen dat ze met elkaar samenhangen. Naamvallen en woordvolgorde bijvoorbeeld. Wat in een zin het onderwerp is en wat het lijdend voorwerp, dat zie je in sommige talen aan de plaats die woorden in de zin hebben, de woordvolgorde dus. In andere talen zie je dat vooral aan de uitgangen (of voorvoegsels) die zelfstandige naamwoorden krijgen: naamvallen dus.
Een bekende taalkundige hypothese zegt: hoe uitgebreider het systeem van naamvallen, hoe vrijer de woordvolgorde. Een omgekeerd: in talen zonder naamvallen is de woordvolgorde heel rigide. Ook deze hypothese is met behulp van Grambank getest. En inderdaad, het blijkt te kloppen. Dus dat is mooi.
Ingewikkelder ligt het voor een andere populaire hypothese. Die luidt: hoe ingewikkelder het werkwoord (veel uitgangen, veel voorvoegsels), hoe simpeler het zelfstandig naamwoord (nauwelijks uitgangen of voorvoegsels), en vice versa. De gedachte hierachter is: als je heel veel grammaticale informatie in het werkwoord stopt, dan hoef je dat niet ook nog eens in het zelfstandig naamwoord te stoppen, en vice versa. Bovendien, als je dat wel zou doen, zou het formuleren van zinnen onnodig zwaar worden. En niet efficiënt.
De computer ging na of het klopt: hoe complexer het werkwoord, hoe simpeler het zelfstandig naamwoord, en omgekeerd. De uitkomst is dat het zeker geen universeel geldende waarheid is. Wel zijn er duidelijk bepaalde patronen te zien binnen taalfamilies. Binnen de Indo-Europese talen is er inderdaad zo’n omgekeerd verband. Binnen de Sino-Tibetaanse taalfamilie (Chinese talen, Tibetaanse talen) juist niet. Daar geldt: hoe complexer het werkwoord, hoe complexer ook het zelfstandige naamwoord.
Skirgård: „Je moet je goed realiseren dat veel van die hypotheses al meer dan een halve eeuw geleden zijn geopperd. Ze waren gebaseerd op de kennis van een beperkt aantal talen. Tussen de 20 en 120 talen, zeg maar. Waarbij bepaalde taalfamilies oververtegenwoordigd waren, en andere ondervertegenwoordigd.”
Inmiddels kunnen er 2.400 talen met elkaar vergeleken worden. En over een tijdje zijn dat er waarschijnlijk 3.500. „We hebben nu meer data dan ooit tevoren”, zegt Skirgård. „Dus we gaan nog opwindende dingen meemaken, denk ik.”