Uma lei fenomenológica também chamada lei do dígito primário, fenómeno do primeiro dígito, ou fenómeno do dígito principal. A lei de Benford afirma que nas listas, tabelas de estatísticas, etc., o dígito 1 tende a ocorrer com probabilidade ∼30%, muito superior aos 11,1% esperados (ou seja, um dígito em cada 9). A lei de Benford é frequentemente observada, a título de exemplo, examinando tabelas de logaritmos e observando que as páginas primárias estão muito mais gastas e manchadas do que as páginas posteriores (Newcomb 1881). Embora a lei de Benford se aplique inquestionavelmente a várias situações no mundo, só recentemente foi dada uma explicação satisfatória através do trabalho de Hill (1998).

A lei de Benford foi utilizada pela personagem Charlie Eppes como uma analogia para ajudar a resolver uma série de roubos elevados no episódio 2 “The Running Man” (2006) do drama de crimes televisivos NUMB3RS.

A lei de Benford aplica-se a dados que não são sem dimensão, por isso os valores numéricos da informação dependem das unidades. Se existe uma distribuição universal de probabilidade P(x) sobre esses números, então deve ser invariante sob uma mudança de escala, portanto

P(kx)=f(k)P(x).

(1)

Se intP(x)dx=1, então intP(kx)dx=1/k, e a normalização implica f(k)=1/k. Diferenciando com referência a k e fixando k=1 obtém-se

xP^'(x)=-P(x),

(2)

com a solução P(x)=1/x. Embora esta não seja frequentemente uma distribuição de probabilidade correcta (uma vez que diverge), tanto as leis da física como a convenção humana impõem cortes. por exemplo , endereços de rua seleccionados aleatoriamente obedecem a algo à beira da lei de Benford .

BenfordsLaw

Se muitas potências de 10 se situarem entre os cortes, então a probabilidade de o dígito primário (decimal) ser D é dada por uma distribuição logarítmica

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

para D=1, …, 9, ilustrado acima e tabelado abaixo.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

No entanto, a lei de Benford aplica-se não só a dados variáveis em escala, mas também a números escolhidos a partir de uma multiplicação de várias fontes. Explicar este facto requer uma investigação mais rigorosa dos teoremas centrais semelhantes aos limites para as mantissas das variáveis aleatórias em multiplicação. Hill (1998) demonstrou rigorosamente que a “distribuição das distribuições” dada por amostras aleatórias retiradas de uma dispersão de várias distribuições é, de facto, a lei de Benford (Matthews).

Um exemplo notável da lei de Benford é dado pelas 54 milhões de constantes reais da base de dados “Calculadora Simbólica Inversa” de Plouffe, 30% das quais começam com o dígito 1. Tomando dados de várias fontes díspares, o quadro abaixo mostra a distribuição dos primeiros dígitos compilados por Benford

col. título 1 2 3 4 5 6 7 8 9 amostras

A Rios, Área 31,0 16,4 10,7 11,3 7,2 8,6 5,5 4,2 5,1 335

B População 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

C Constantes 41,3 14,4 4,8 8,6 10,6 10,6 5,8 1,0 2,9 10,6 104

D Jornais 30,0 18,0 12,0 10,0 8,0 8,0 6,0 6,0 5,0 5,0 5,0 100

E Calor específico 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389

F Pressão 29,6 18,3 12,8 9,8 8,3 8,3 6,4 5,7 4,4 4,4 4,7 703

G H.P. Perdido 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690

H Mol. Wgt. 26,7 25,2 15,4 10,8 6,7 5,1 4,1 2,8 3,2 1800

I Drenagem 27,1 23,9 13,8 12,6 8,2 5,0 5,0 5,0 2,5 1,9 159

J TBC Atómica 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25.7 20.3 9.7 6.8 6.6 6.8 7.2 8.0 8.9 5000

L Concepção 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560

M Reader’s Digest 33,4 18,5 12,4 7,5 7,5 7,1 6,5 5,5 4,9 4,2 308

N Dados de custo 32,4 18,8 10,1 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

O Raio X Volts 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

P Am. Liga 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458

Q Corpo negro 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

R Endereços 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Taxa de Morte 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

Média 30,6 18,5 12,4 9,4 8,0 6,4 5,1 4,9 4,7 1011

Erro Provável +/-0.8 +/-0.4 +/-0.4 +/-0.3 +/-0.2 +/-0.2 +/-0.2 +/-0.3

O quadro seguinte apresenta a distribuição do primeiro dígito da mantissa seguindo a Lei de Benford, utilizando uma série de métodos diferentes.

método Sequência OEIS

Sainte-Lague A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

d’Hondt A055440 1, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, …

maior remanescente, quotas de lebre A055441 1, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, …

maior remanescente, Quotas Droop A055442 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, …