Ein phänomenologisches Gesetz, das auch als Gesetz der primären Ziffer, Phänomen der ersten Ziffer oder Phänomen der führenden Ziffer bezeichnet wird. Das Benfordsche Gesetz besagt, dass in Auflistungen, Tabellen von Statistiken usw. die Ziffer 1 mit einer Wahrscheinlichkeit von ∼30% auftritt, die viel größer ist als die erwarteten 11,1% (d.h. eine von 9 Ziffern). Das Benfordsche Gesetz wird oft beobachtet, indem man z.B. Logarithmentafeln untersucht und feststellt, dass die Primärseiten viel abgenutzter und verschmierter sind als spätere Seiten (Newcomb 1881). Während das Benfordsche Gesetz zweifellos auf mehrere Situationen in der Welt anwendbar ist, wurde erst kürzlich durch die Arbeit von Hill (1998) eine zufriedenstellende Erklärung gegeben.

Benfords Gesetz wurde von der Figur Charlie Eppes als Analogie eingesetzt, um bei der Aufklärung einer Reihe von Einbrüchen mit hohem Einbruchsvolumen in der Episode “The Running Man” (2006) der Staffel 2 des Fernsehkrimi-Dramas NUMB3RS zu helfen.

Das Benfordsche Gesetz gilt für Daten, die nicht dimensionslos sind, daher hängen die numerischen Werte der Informationen von den Einheiten ab. Wenn es eine universelle Wahrscheinlichkeitsverteilung P(x) über solche Zahlen gibt, dann muss sie bei einer Änderung der Skala invariant sein, also

P(kx)=f(k)P(x).

(1)

Wenn intP(x)dx=1, dann intP(kx)dx=1/k, und die Normierung impliziert f(k)=1/k. Differenzieren in Bezug auf k und Setzen von k=1 ergibt

xP^'(x)=-P(x),

(2)

mit der Lösung P(x)=1/x. Obwohl dies oft keine korrekte Wahrscheinlichkeitsverteilung ist (da sie divergiert), schreiben sowohl die Gesetze der Physik als auch die menschliche Konvention Grenzwerte vor. Zum Beispiel gehorchen zufällig ausgewählte Straßenadressen etwas am Rande des Benfordschen Gesetzes.

BenfordsGesetz

Wenn viele Zehnerpotenzen zwischen den Grenzwerten liegen, dann ist die Wahrscheinlichkeit, dass die primäre (dezimale) Stelle D ist, durch eine logarithmische Verteilung gegeben

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

für D=1, …, 9, oben abgebildet und unten tabellarisch dargestellt.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

Das Benfordsche Gesetz gilt jedoch nicht nur für maßstabsinvariante Daten, sondern auch für Zahlen, die aus einer Vielzahl verschiedener Quellen ausgewählt wurden. Um diese Tatsache zu erklären, ist eine genauere Untersuchung der zentralen grenzwertähnlichen Theoreme für die Mantissen von Zufallsvariablen bei der Multiplikation erforderlich. Da die Anzahl der Variablen zunimmt, nähert sich die Dichtefunktion der obigen logarithmischen Verteilung an. Hill (1998) zeigte rigoros, dass die “Verteilung der Verteilungen”, die durch Zufallsstichproben aus einer Streuung verschiedener Verteilungen gegeben ist, tatsächlich das Benfordsche Gesetz (Matthews) ist.

Ein markantes Beispiel für das Benfordsche Gesetz sind die 54 Millionen reellen Konstanten in Plouffe’s “Inverse Symbolic Calculator”-Datenbank, von denen 30% mit der Ziffer 1 beginnen. Unter Verwendung von Daten aus mehreren unterschiedlichen Quellen zeigt die folgende Tabelle die Verteilung der ersten Ziffern, wie sie von Benford zusammengestellt wurden

col. Titel 1 2 3 4 5 6 7 8 9 Proben

A Flüsse, Gebiet 31,0 16,4 10,7 11,3 7,2 8,6 5,5 4,2 5,1 335

B Bevölkerung 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

C-Konstanten 41,3 14,4 4,8 8,6 10,6 5,8 1,0 2,9 10,6 104

D Zeitungen 30,0 18,0 12,0 10,0 8,0 8,0 6,0 6,0 5,0 5,0 100

E Spezifische Wärme 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389

F Druck 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,7 703

G H.P. verloren 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 5,1 3,6 690

H Mol. Wgt. 26,7 25,2 15,4 10,8 6,7 5,1 4,1 4,1 2,8 3,2 1800

I Entwässerung 27,1 23,9 13,8 12,6 8,2 5,0 5,0 5,0 2,5 1,9 159

J Atomare Wgt. 47,2 18,7 18,7 5,5 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25,7 20,3 9,7 6,8 6,6 6,8 7,2 8,0 8,9 5000

L-Entwurf 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560

M Reader’s Digest 33,4 18,5 12,4 12,4 7,5 7,1 6,5 5,5 4,9 4,2 308

N Kostendaten 32,4 18,8 10,1 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

O Röntgenvolt 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

P Am. Liga 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458

Q Schwarzkörper 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

R Adressen 28.9 19.2 12.6 8.8 8.5 6.4 5.6 5.0 5.0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Sterberate 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

Durchschnitt 30,6 18,5 12,4 9,4 8,0 6,4 5,1 4,9 4,7 1011

Wahrscheinlicher Fehler +/-0,8 +/-0,4 +/-0,4 +/-0,4 +/-0,3 +/-0,2 +/-0,2 +/-0,2 +/-0,3

Die folgende Tabelle zeigt die Verteilung der ersten Ziffer der Mantisse nach dem Benfordschen Gesetz unter Verwendung verschiedener Methoden.

Methode OEIS-Sequenz

Sainte-Lague A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

d’Hondt A055440 1, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, …

größter Rest, Hasenquoten A055441 1, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, …

größter Rest, Pannenquoten A055442 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, …