Een fenomenologische wet wordt ook wel de primaire cijfermatige wet, het eerste cijfermatige fenomeen of het belangrijkste cijfermatige fenomeen genoemd. De wet van Benford stelt dat in lijsten, tabellen van statistieken, enz. het cijfer 1 de neiging heeft om met waarschijnlijkheid ∼30% voor te komen, veel meer dan de verwachte 11,1% (d.w.z. één cijfer op 9). De wet van Benford wordt bijvoorbeeld vaak in acht genomen door logaritmentabellen te onderzoeken en op te merken dat de primaire pagina’s veel meer versleten en bevlekt zijn dan latere pagina’s (Newcomb 1881). Hoewel de wet van Benford ontegenzeggelijk van toepassing is op verschillende situaties in de wereld, is er pas recentelijk een bevredigende verklaring voor gegeven door het werk van Hill (1998).

De wet van Benford werd door het personage Charlie Eppes als analogie gebruikt om te helpen bij het oplossen van een reeks hoge inbraken binnen de Seizoen 2 “The Running Man” aflevering (2006) van het tv-misdaaddrama NUMB3RS.

De wet van Benford is van toepassing op gegevens die niet dimensieloos zijn, daarom zijn de numerieke waarden van de informatie afhankelijk van de eenheden. Als er een universele kansverdeling P(x) over zulke getallen bestaat, dan moet die invariant zijn bij een schaalverandering, dus

P(kx)=f(k)P(x).

(1)

Als intP(x)dx=1, dan intP(kx)dx=1/k, en normalisatie impliceert f(k)=1/k. Differentiëren met betrekking tot k en het instellen van k=1 geeft

xP^'(x)=P(x),

(2)

met oplossing P(x)=1/x. Hoewel dit vaak geen correcte kansverdeling is (omdat het afwijkt), leggen zowel de wetten van de natuurkunde als de menselijke conventie cutoffs op. Zo gehoorzamen willekeurig gekozen straatadressen iets aan de rand van de wet van Benford.

Benfordswet

Als er veel krachten van 10 tussen de cutoffs liggen, dan wordt de waarschijnlijkheid dat het primaire (decimale) cijfer D is gegeven door een logaritmische verdeling

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

voor D=1, …, 9, hierboven geïllustreerd en hieronder getabelleerd.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

De wet van Benford is echter niet alleen van toepassing op schaalinvariante gegevens, maar ook op getallen die worden gekozen uit een spreiding van verschillende bronnen. Om dit feit te verklaren is een rigoureuzer onderzoek nodig naar centrale limietachtige stellingen voor de mantissas van willekeurige variabelen onder vermenigvuldiging. omdat het aantal variabelen toeneemt, benadert de dichtheidsfunctie die van de bovenstaande logaritmische verdeling. Hill (1998) heeft rigoureus aangetoond dat de “verdeling van de verdelingen” gegeven door willekeurige steekproeven genomen uit een spreiding van verschillende verdelingen in feite de wet van Benford is (Matthews).

Een treffend voorbeeld van Benfords wet wordt gegeven door de 54 miljoen echte constanten in Plouffe’s “Inverse Symbolic Calculator” database, waarvan 30% begint met het cijfer 1. De onderstaande tabel toont de verdeling van de eerste cijfers, zoals samengesteld door Benford, uit verschillende verschillende bronnen.

kol. titel 1 2 3 4 5 6 7 8 9 monsters

A Rivieren, gebied 31,0 16,4 10,7 11,3 7,2 8,6 5 4,2 5,1 335

B Bevolking 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

C Constanten 41,3 14,4 4,8 8,6 10,6 5,8 1,0 2,9 10,6 104

D Kranten 30,0 18,0 12,0 10,0 8,0 6,0 6,0 5,0 5,0 100

E Specifieke warmte 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389

F Druk 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,7 703

G H.P. Verloren 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690

H Mol. Wgt. 26,7 25,2 15,4 10,8 6,7 5,1 4,1 2,8 3,2 1800

I Drainage 27,1 23,9 13,8 12,6 8,2 5,0 5,0 2,5 1,9 159

J Atoom Wgt. 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25,7 20,3 9,7 6,8 6,6 6,8 7,2 8,0 8,9 5000

L Ontwerp 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560

M Reader’s Digest 33,4 18,5 12,4 7,5 7,1 6,5 5,5 4,9 4,2 308

N Kostengegevens 32,4 18,8 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

O Röntgenspanning 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

P Am. Liga 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458

Q Blackbody 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

R Adressen 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Sterftecijfer 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

Gemiddeld 30,6 18,5 12,4 9,4 8,0 6,4 5,1 4,9 4,7 1011

Waarschijnlijk fout +/-0.8 +/-0.4 +/-0.4 +/-0.3 +/-0.2 +/-0.2 +/-0.2 +/-0.3

De volgende tabel geeft de verdeling van het eerste cijfer van de bidsprinkhaan volgens Benford’s Law met behulp van een aantal verschillende methoden.

methode OEIS-vervolgorde

Sainte-Lague A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

d’Hondt A055440 1, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, …

grootste restant, Harequota A055441 1, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, …

grootste restant, Droop-quota A055442 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, …