Una ley fenomenológica también llamada ley del primer dígito, fenómeno del primer dígito o fenómeno del dígito principal. La ley de Benford establece que en los listados, tablas estadísticas, etc., el dígito 1 tiende a ocurrir con una probabilidad ∼30%, mucho mayor que el esperado 11,1% (es decir, un dígito de cada 9). La ley de Benford se observa a menudo, como ejemplo , examinando tablas de logaritmos y observando que las páginas primarias están mucho más desgastadas y manchadas que las páginas posteriores (Newcomb 1881). Si bien la ley de Benford se aplica incuestionablemente a varias situaciones en el mundo, sólo recientemente se ha dado una explicación satisfactoria a través de la obra de Hill (1998).

La ley de Benford fue empleada por el personaje Charlie Eppes como analogía para ayudar a resolver una serie de robos de alto nivel dentro del episodio de la segunda temporada de “The Running Man” (2006) del drama policíaco televisivo NUMB3RS.

La ley de Benford se aplica a los datos que no son adimensionales, por lo tanto los valores numéricos de la información dependen de las unidades. Si existe una distribución de probabilidad universal P(x) sobre tales números, entonces debe ser invariable bajo un cambio de escala, por lo que

P(kx)=f(k)P(x).

(1)

Si intP(x)dx=1, entonces intP(kx)dx=1/k, y la normalización implica f(k)=1/k. Diferenciando con referencia a k y estableciendo k=1 se obtiene

xP^'(x)=-P(x),

(2)

que tiene la solución P(x)=1/x. Aunque a menudo no se trata de una distribución de probabilidad correcta (ya que difiere), tanto las leyes de la física como las convenciones humanas imponen límites. Por ejemplo, las direcciones de calles seleccionadas al azar obedecen a algo que está al borde de la ley de Benford.

BenfordsLaw

Si entre los límites se encuentran muchas potencias de 10, la probabilidad de que el dígito primario (decimal) sea D viene dada por una distribución logarítmica

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

para D=1, …, 9, ilustrado arriba y tabulado abajo.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

Sin embargo, la ley de Benford se aplica no sólo a los datos de escala invariable, sino también a los números escogidos de una dispersión de diversas fuentes. Para explicar este hecho se requiere una investigación más rigurosa de los teoremas centrales de límites para las mantisas de las variables aleatorias bajo multiplicación. Debido a que el número de variables aumenta, la función de densidad se aproxima a la de la distribución logarítmica anterior. Hill (1998) demostró rigurosamente que la “distribución de las distribuciones” dada por muestras aleatorias tomadas de una dispersión de varias distribuciones es, de hecho, la ley de Benford (Matthews).

Un ejemplo sorprendente de la ley de Benford lo constituyen los 54 millones de constantes reales de la base de datos de la “Calculadora Simbólica Inversa” de Plouffe, el 30% de las cuales comienzan con el dígito 1. Tomando datos de varias fuentes dispares, el cuadro siguiente muestra la distribución de los primeros dígitos según lo compilado por Benford

col. título 1 2 3 4 5 6 7 8 9 muestras

A Ríos, Área 31.0 16.4 10.7 11.3 7.2 8.6 5.5 4.2 5.1 335

B Población 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

C Constantes 41.3 14.4 4.8 8.6 10.6 5.8 1.0 2.9 10.6 104

D Periódicos 30.0 18.0 12.0 10.0 8.0 6.0 6.0 5.0 5.0 100

E Calor Específico 24.0 18.4 16.2 14.6 10.6 4.1 3.2 4.8 4.1 1389

F Presión 29.6 18.3 12.8 9.8 8.3 6.4 5.7 4.4 4.7 703

G H.P. Perdido 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690

H Mol. Wgt. 26,7 25,2 15,4 10,8 6,7 5,1 4,1 2,8 3,2 1800

I Drenaje 27.1 23.9 13.8 12.6 8.2 5.0 5.0 2.5 1.9 159

J Atómica 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25.7 20.3 9.7 6.8 6.6 6.8 7.2 8.0 8.9 5000

L Diseño 26,8 14,8 14,3 7,5 8,3 8,4 7,0 7,3 5,6 560

M Reader’s Digest 33.4 18.5 12.4 7.5 7.1 6.5 5.5 4.9 4.2 308

N Datos de costos 32,4 18,8 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

O Voltios de rayos X 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

P Am. Liga 32.7 17.6 12.6 9.8 7.4 6.4 4.9 5.6 3.0 1458

Q Cuerpo negro 31.0 17.3 14.1 8.7 6.6 7.0 5.2 4.7 5.4 1165

R Direcciones 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Tasa de mortalidad 27.0 18.6 15.7 9.4 6.7 6.5 7.2 4.8 4.1 418

Promedio 30,6 18,5 12,4 9,4 8,0 6,4 5,1 4,9 4,7 1011

Error Probable +/-0.8 +/-0.4 +/-0.4 +/-0.3 +/-0.2 +/-0.2 +/-0.2 +/-0.3

La siguiente tabla muestra la distribución del primer dígito de la mantisa según la Ley de Benford, utilizando varios métodos diferentes.

método Secuencia OEIS

Sainte-Lague A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

d’Hondt A055440 1, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, …

el mayor remanente, Cuota de liebre A055441 1, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1, …

el mayor resto, cuotas de liebre A055442 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, …