Van Maanen | Hans van Maanen | |||||||||||||||||||||||||||||||||
Archimedes, Newton, MurphyWat hebben Archimedes, Mendel, Murphy en Snellius met elkaar gemeen? Ieder op hun gebied waren het grote geleerden die in de geschiedenis van de wetenschap hun ereplaats ruim verdiend hebben. Maar hun bekendheid reikt verder dan die van menig even bekwaam en geleerd vakgenoot, doordat zij hun naam hebben gegeven aan befaamd geworden wetten.
|
Foto: Harry Benford |
Als u de blaadjes aan een willekeurige boom telt, hoe groot is dan de kans dat het eerste cijfer van dat aantal een 1 is? Veel groter dan 1 op 9, namelijk bijna 1 op 3. En de kans dat het aantal inwoners van uw woonplaats met een 1 begint? Ook bijna 1 op 3.
Het klinkt als waanzin, maar het is een wiskundige wet: de wet van Benford. De wet van Benford is bovendien aardig omdat het een van de zeldzame ervaringswetten is die de wiskunde heeft voortgebracht -- men werkt daar liever met abstracte axiomas en stellingen die niets met de werkelijkheid te maken hebben.
De wet heeft zijn oorsprong in de jaren dertig van deze eeuw, toen de Amerikaanse natuurkundige Frank Benford een al veel oudere observatie, van de sterrenkundige Simon Newcomb, systematisch onderzocht. Het was Newcomb in 188I opgevallen dat logaritmetafels over het algemeen vooraan meer beduimeld zijn dan achteraan. Met logaritmes worden grote getallen handzaam gemaakt, en de conclusie zou kunnen zijn, dat er vaker logaritmes worden opgezocht van getallen die met een 1 of een 2 beginnen dan met een 8 of een 9. Beginnen grote getallen vaker met lage cijfers?
Benford onderzocht twintig tabellen met grote getallen -- oppervlakten van zeeën, lengten van rivieren, aantal inwoners van steden, moleculegewichten enzovoort. Na het tellen van 20 229 van dergelijke gegevens moest zijn conclusie onontkoombaar zijn dat inderdaad de lage cijfers vaker voorkomen dan de hoge, en wel in de percentages 30,1, 17,6, 12,5, 9,7, 7,9, 6,7, 5,8, 5,1, 4, 6. Bijna de helft van alle getallen begint met een 1 of een 2, voor de 8 en de 9 samen is amper tien procent over. De eerste pagina van de logaritmetafel wordt zeker zes keer zo snel vies als de laatste.
Benford maakte meteen al een voorbehoud. Een lijst met de hoogste bergen ter wereld in meters zal een duidelijke voorkeur voor de 8 hebben, want de lijst is beperkt en de opstellers van de lijst beginnen bovenaan. Maar, zei Benford, als je een lijst met willekeurige hoogten zou nemen, zou de 1 weer worden bevoorrecht. Ook tabellen met bijvoorbeeld de jaarlijkse regenval is niet eerlijk genoeg, want die getallen liggen allemaal om een zeker gemiddelde.
Wiskundige rijen voldoen echter wel. De verdeling van Benford kan zelfs zeer eenvoudig worden gemaakt met meetkundige rijen -- dat is een rij waarbij elk volgend getal wordt gemaakt door het vorige met een vast getal te vermenigvuldigen (bij een rekenkundige rij wordt opgeteld in plaats van vermenigvuldigd). Bij voorbeeld de meetkundige rij: 1, 2, 4, 8, 16, 32, ... levert over de eerste honderd getallen al de volgende verdeling van eerste cijfers van 1 tot en met 9: 30, 17, 13, 10, 7, 7, 6, 5, 5.
Benford wist zijn vondst in een fraaie wiskundige formule te gieten, en die bood hij in 1938 aan aan het tijdschrift van de Amerikaanse filosofische vereniging als de wet van de afwijkende getallen. Daarmee wilde hij dus benadrukken dat de getallen niet vantevoren al een zekere ordening zijn toegekend. Tegenwoordig heet hij de wet van Benford: in een verzameling afwijkende getallen is de kans dat het eerste cijfer n is, gelijk aan de logaritme van (n+1)/n. Dat levert de bovengenoemde percentages.
n | log(n) | log(n+1) - log(n) |
1 | 0,00000 | 0,30103 |
2 | 0,30103 | 0,17609 |
3 | 0,47712 | 0,12494 |
4 | 0,60206 | 0,09691 |
5 | 0,69897 | 0,07918 |
6 | 0,77815 | 0,06695 |
7 | 0,84510 | 0,05799 |
8 | 0,90309 | 0,05115 |
9 | 0,95424 | 0,04576 |
Ook Newcomb was al tot deze formule gekomen, maar hij had haar niet tot natuurwet verheven. Benford beschouwde zijn vinding wel als zodanig. Hij deed zelfs een poging zijn wet uit de natuur te verklaren. Volgens hem lag het in de aard der dingen dat zijn wet opging. De clou vond hij in de meetkundige rij zoals hierboven is gegeven. De natuurlijke manier van tellen, aldus Benford, is niet 1, 2, 3, 4, . . . maar 1, 2, 4, 8, ... -- dus niet rekenkundig maar meetkundig. Een meetkundige rij is nauw verwant met logaritmes, en Benford verwees naar onder andere naar de wet van Weber, naar de toonladder en naar de groei en sterfte van bacteriekolonies. 'De natuur', concludeerde hij, 'telt logaritmisch en bouwt en functioneert op die manier'.
Wiskundigen reageerden nogal skeptisch -- vooral het voorbehoud dat de getallen afwijkend moesten zijn, is nogal vaag. Daar houden wiskundigen niet van. Zijn de huisnummers van een straat afwijkend? Benford haalde ze als voorbeeld aan, maar enig nadenken leert dat de kans op een huisnummer dat met een 1 begint, groter is dan de kans dat een huisnummer met een 9 begint. In een straat met twintig huizen is de kans zelfs meer dan vijftig procent.
Maar voor andere lijsten konden de twijfelaars niet altijd een logische verklaring geven.
De zaak leek nog vreemder te worden toen bleek dat de wet onafhankelijk was van de eenheid waarin was gemeten. Benford, als Amerikaan, nam lijsten met mijlen en voeten, maar continentale wiskundigen namen lijsten met meters. Niettemin bleef de wet van Benford gelden. Of de oppervlakte nu in acres, in hectares of in Amsterdamse morgens werd uitgedrukt: steeds voldeden de lijsten aan de wet. Alle getallen veranderden, maar de verdeling van de eerste cijfers bleefbestaan.
De volgende stap werd gezet toen bleek dat de gewone vermenigvuldiging bijna altijd een verdeling oplevert zoals de wet voorschrijft. Zelfs zoiets eenvoudigs als de tafels van vermenigvuldiging van 1 tot en met 10 leidt al tot de verdeling 21, 17, 13, 14, 8, 9, 6, 7, 5. Als we dat vier keer doen, dus de eerste cijfers nemen van 1 maal 1 maal 1 maal 1 tot 10 maal 10 maal 10 maal 10, is de verdeling vrijwel perfect. Maar wordt het nu niet wat erg simpel? Als de tafel van tien al een Benford-achtige verdeling oplevert, zijn we dan niet wat triviaal bezig?
Voor wiskundigen is de aardigheid er nu inderdaad een beetje af. De vermenigvuldigingstafels leveren de oplossing. We kunnen hieruit afleiden dat een verzameling producten van vier willekeurige getallen tussen 1 en 10 aan de wet van Benford voldoet -- anders gezegd: neem vier getallen tussen de 1 en de 10, vermenigvuldig die met elkaar, en de kans dat het product met een 1 begint is dertig procent.
En dat is meestal wat er in de Natuur gebeurt. De natuurwetten in dit boek bewijzen dat: ze zijn meestal in de vorm van evenredigheden gegoten -- als producten. De gravitatiewet van Newton vermenigvuldigt vier factoren, de derde wet van Kepler vijf, enzovoort. Het aantal blaadjes aan een boom is de uitkomst van talrijke factoren -- zonlicht, vruchtbaarheid, regenval -- die met elkaar een product opleveren dat statistisch voldoet aan de wet van Benford. Naast wat Benford het meetkundig tellen van de natuur noemde, is er dus ook vaak het tellen in producten. Tezamen geven ze een afdoende verklaring voor vrijwel alle getallen die in de natuur voorkomen.
Maar nog niet beantwoord is de vraag waardoor het sterkste voorbeeld van Benford opgaat: pak de voorpagina van de krant en zoek daarin alle in cijfers geschreven getallen. De eerste cijfers van al die getallen voldoen aan de wet van Benford.