Una legge fenomenologica chiamata anche legge della cifra primaria, fenomeno della prima cifra, o fenomeno della prima cifra. La legge di Benford afferma che nelle liste, nelle tabelle statistiche, ecc., la cifra 1 tende a verificarsi con probabilità ∼30%, molto maggiore dell’11,1% previsto (cioè, una cifra su 9). La legge di Benford viene spesso osservata, a titolo di esempio, esaminando le tabelle dei logaritmi e notando che le pagine primarie sono molto più usurate e sbavate rispetto alle pagine successive (Newcomb 1881). Mentre la legge di Benford si applica indiscutibilmente a diverse situazioni nel mondo, una spiegazione soddisfacente è stata data solo recentemente attraverso il lavoro di Hill (1998).

La legge di Benford è stata utilizzata dal personaggio Charlie Eppes come analogia per aiutare a risolvere una serie di furti con scasso all’interno dell’episodio della Stagione 2 “The Running Man” (2006) del telefilm NUMB3RS.

La legge di Benford si applica ai dati che non sono adimensionali, quindi i valori numerici delle informazioni dipendono dalle unità. Se esiste una distribuzione universale di probabilità P(x) su tali numeri, allora deve essere invariante sotto un cambiamento di scala, quindi

P(kx)=f(k)P(x).

(1)

Se intP(x)dx=1, allora intP(kx)dx=1/k, e la normalizzazione implica f(k)=1/k. Differenziando con riferimento a k e impostando k=1 si ottiene

xP^'(x)=-P(x),

(2)

con soluzione P(x)=1/x. Anche se spesso questa non è una distribuzione di probabilità corretta (poiché diverge), sia le leggi della fisica che le convenzioni umane impongono dei tagli. per esempio, gli indirizzi stradali selezionati a caso obbediscono a qualcosa che è al limite della legge di Benford.

BenfordsLaw

Se molte potenze di 10 si trovano tra i cutoff, allora la probabilità che la cifra primaria (decimale) sia D è data da una distribuzione logaritmica

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

per D=1, …, 9, illustrato sopra e tabulato sotto.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

Tuttavia, la legge di Benford non si applica solo ai dati a scala variabile, ma anche ai numeri scelti da una serie di fonti diverse. Spiegare questo fatto richiede un’indagine più rigorosa dei teoremi limite centrale per le mantisse delle variabili casuali in moltiplicazione. poiché il numero di variabili aumenta, la funzione di densità si avvicina a quella della distribuzione logaritmica di cui sopra. Hill (1998) ha rigorosamente dimostrato che la “distribuzione delle distribuzioni” data da campioni casuali presi da una diffusione di varie distribuzioni è, di fatto, la legge di Benford (Matthews).

Un esempio lampante della legge di Benford è dato dai 54 milioni di costanti reali del database “Inverse Symbolic Calculator” di Plouffe, il 30% dei quali inizia con la cifra 1. Prendendo i dati da diverse fonti diverse, la tabella seguente mostra la distribuzione delle prime cifre come compilato da Benford

col. titolo 1 2 3 3 4 5 6 7 8 9 campioni

A Fiumi, Area 31,0 16,4 10,7 11,3 7,2 8,6 5,5 5,5 4,2 5,1 335

B Popolazione 33,9 20,4 14,2 8,1 7,2 7,2 6,2 4,1 3,7 2,2 3259

C Costanti 41,3 14,4 14,4 4,8 8,6 10,6 10,6 5,8 1,0 2,9 10,6 104

D Giornali 30,0 18,0 12,0 12,0 10,0 8,0 6,0 6,0 6,0 5,0 5,0 5,0 100

E Calore specifico 24,0 18,4 16,2 14,6 14,6 10,6 4,1 3,2 4,8 4,1 1389

F Pressione 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,4 4,7 703

G H.P. Perduto 30,0 18,4 11,9 10,8 8,1 8,1 7,0 5,1 5,1 5,1 3,6 6 690

H Mol. Wgt. 26,7 25,2 25,2 15,4 10,8 6,7 6,7 5,1 4,1 2,8 3,2 1800

I Drenaggio 27,1 23,9 13,8 12,6 8,2 5,0 5,0 5,0 2,5 1,9 159

J Atomico Wgt. 47,2 18,7 5,5 4,4 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25,7 20,3 9,7 6,7 6,8 6,6 6,8 7,2 8,0 8,9 5000

L Design 26,8 14,8 14,8 14,3 7,5 8,3 8,3 8,4 7,0 7,3 5,6 560

M Reader’s Digest 33,4 18,5 12,4 12,4 7,5 7,1 6,5 5,5 5,5 4,9 4,2 308

N Dati sui costi 32,4 18,8 18,8 10,1 10,1 9,8 5,5 5,5 4,7 5,5 3,1 741

O Raggi X Volt 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,1 5,8 4,8 4,8 707

P Am. Lega 32,7 17,6 17,6 12,6 9,8 7,4 6,4 6,4 4,9 5,6 3,0 1458

Q Corpo nero 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

R Indirizzi 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 5,0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Tasso di mortalità 27,0 18,6 15,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

Media 30,6 18,5 12,4 9,4 8,0 6,4 5,4 5,1 4,9 4,7 1011

Errore probabile +/-0.8 +/-0.4 +/-0.4 +/-0.4 +/-0.3 +/-0.2 +/-0.2 +/-0.2 +/-0.2 +/-0.2 +/-0.3

La seguente tabella fornisce la distribuzione della prima cifra della mantissa secondo la legge di Benford utilizzando una serie di metodi diversi.

metodo sequenza OEIS

Sainte-Lague A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

d’Hondt A055440 1, 2, 1, 1, 3, 1, 4, 2, 2, 5, 1, 6, 3, 1, …

più grande resto, Quote di lepre A055441 1, 2, 3, 4, 1, 5, 6, 6, 7, 1, 2, 8, 1, 1, …

il più grande resto, Quote di Droop A055442 1, 2, 3, 1, 4, 5, 5, 6, 1, 2, 7, 8, 1, 1, …