N.B. Het kan zijn dat elementen ontbreken aan deze printversie.
Wekelijks stuit Karel Knip in de alledaagse werkelijkheid op raadsels en onbegrijpelijke verschijnselen.
Deze week: wat het vuil op een toetsenbord zegt over de gebruiker ervan.
Dit is het toetsenbord waarop de AW-rubriek wordt getikt. Hij is tien jaar oud maar staat nog steeds zijn mannetje. Er is wel eens een toets die niet reageert maar dat was tot dusver steeds te verhelpen door het toetsenbord ondersteboven te houden en leeg te kloppen. De toets met de verkeerd gerichte schuine streep zit los. Hij werd ooit losgewrikt om te bekijken hoe-ie vast zat maar wilde daarna niet meer terug op zijn plaats. Veel meer valt er over het toetsenbord niet te vertellen.
Ja: de toetsen zijn vies. Je ziet spatten ingedroogde koffie en instant prei crème van Unilever tegen een vettige achtergrond die niet goed is thuis te brengen. Het kan talg zijn dat al tikkend uit de vingerhuid werd geperst of gewoon vuil dat de vingers elders opliepen. Vandaag is van belang dat de toetsen die het vaakst werden aangeslagen in het midden juist weer schoon werden, ze zijn schoongetikt. Het centrum van de toetsen is onder het veelvuldig vingeren zó gepolijst dat het vuil niet meer hangen blijft.
Laat je het lamplicht op de juiste manier over de toetsen strijken dan haal je er de meest gepolijste centra makkelijk uit. Bij het bord op het plaatje zijn het – in alfabetische volgorde – de letters a-d-e-i-m-o-s-t. Het lukte niet een rangorde in het slijten te bepalen.
Timmermansoog over de toetsen
En er zijn meer beperkingen. Het is aannemelijk dat rechtshandigen de toetsen rechts met de rechterhand harder aanslaan dan de toetsen links met de linkerhand. Sowieso worden de twee handen zelden in gelijke positie boven de toetsen gebracht, vooral bij eenvingerig typen is het verschil frappant. Een wandeling over de redactiezaal van een middelgrote krant laat het zien. Er zijn ook filmpjes van te vinden. Waarschijnlijk worden de toetsen in de bovenste letterrij ook systematisch anders aangeslagen dan die in de onderste. Ten slotte zal de rechterhand van de rechtshandige meestal wat viezer zijn dan diens linkerhand.
Kortom: aan haken en ogen geen gebrek, maar laat je je timmermansoog zo eerlijk mogelijk over de toetsen lopen dan durf je toch adeimost de negen meest aangeslagen toetsen noemen. De q, y en x worden het minst gebruikt, daaraan bestaat geen twijfel. Ook de c en z liggen er tamelijk onaangeslagen bij.
De ‘m’ glimt wat meer dan je verwachten zou, de ‘r’ juist wat minder
Zonder moeite vind je op internet programmaatjes die de letters tellen in de stukjes tekst die je ze toestopt. (‘Count letter frequency’.) Voor de laatste vijf afleveringen van de AW-rubriek waren de eerste negen letters in volgorde: enatirods, enatoirds, weer enatirods, enatroids en eanrtidso. Voor alle vijf samen werd het enatirods. Let wel: de AW-rubriek bevat soms citaten in het buitenlands en het gebruikte programmaatje hield hoofdletters apart. Een ander programma bepaalde de lettervolgorde in een heel lange Nederlandse tekst op enatordis. Dezelfde groep letters dus, en de overeenkomst met de groep glimmende toetsen is heel bevredigend. De ‘m’ glimt wat meer dan je verwachten zou, de ‘r’ juist wat minder.
Voor voldoende lange teksten in de Engelse taal is de volgorde volgens het Wikipedia-lemma ‘letter frequency’ (dat ook een foto van een sleets toetsenbord laat zien) meestal: etaoinsrh zodat je vooral uit de slijtage van de letter ‘n’ kan afleiden of er langdurig Nederlands of Engels is getikt. De wiki-foto geeft geen uitsluitsel. Omdat de spelling van het Engels of Nederlands een paar eeuwen geleden nog niet vast lag kun je nu nog aan de hand van letterfrequenties bepalen of teksten wel of niet van Shakespeare of Michiel de Ruyter waren. Met zo’n telprogramma.
Eigenaardig is dat de samenstelling van het morsealfabet, dat zou berusten op uitputtende letterstatistiek, niet in overeenstemming is te brengen met het net genoemde etaoinsrh van Engelse teksten. Aannemende dat de morsestreep drie keer zo lang is als de morsepunt, en dat de spaties binnen de letters de lengte van een punt hebben, vind je als kortste morseletters in volgorde: e-it-san. Dit had voor Engelse tekst e-ta-oin moeten zijn en voor Duitse: e-ni-sra. Die hele letterstatistiek heeft niet veel voorgesteld.
Tikken met de duim
De layout van het qwerty-toetsenbord (zoals dat op de foto) berust trouwens ook voor een deel op statistiek. Er is vaak beweerd dat de samenstelling van het toetsenbord destijds, rond 1870, zó is gekozen dat de typemachine-hamertjes van veel voorkomende lettercombinaties elkaar niet in de weg zouden zitten, maar dat is onzin. Dan had je de ‘e’ en de ‘r’ nooit naast elkaar gezet. Historisch onderzoek van Koichi en Motoko Yasuoka (2011) heeft aangetoond dat het toetsenbord rond 1870 proefondervindelijk net zo lang werd aangepast tot telegrafisten ermee uit de voeten konden.
Typemachines en morsetelegrafie worden niet meer gebruikt en er is dus geen reden om vast te houden aan het qwerty-ontwerp, zeker niet nu er op draagbare telefoons steeds vaker met alleen de duim wordt getikt. Er zijn dan ook veel nieuw lay-outs in ontwikkeling.
Kijken we nog eenmaal naar het vervuilde AW-toetsenbord dan valt op dat ook de cijfers niet allemaal even vaak gebruikt werden. Heel uitgesproken is het beeld niet, maar de cijfers 3, 4 en 5 waren kennelijk niet vaak nodig. Er komen niet veel cijfers voor in de AW-rubriek dus er is niet snel betrouwbare verklarende statistiek verzameld, maar voor de laatste 10 stukjes was de cijferfrequentie in volgorde 0129458736, met een opvallende dominantie van 0, 1, 2 en 9. Die komt, zo te zien, van het frequent gebruik van datums. Maar de cijfers 1 en 2 domineren ook in de afstanden, hoeken, netspanningen en temperaturen die ter sprake kwamen. Dat is de wet van Benford. Heel, heel geheimzinnig.