Феноменологический закон также называется первичным цифровым законом, феноменом первой цифры или феноменом ведущей цифры. Закон Бенфорда гласит, что в списках, таблицах статистики и т.д. цифра 1 имеет тенденцию встречаться с вероятностью ∼30%, намного большей, чем ожидалось 11,1% (т.е. одна цифра из 9). Закон Бенфорда часто наблюдается, например, при рассмотрении таблиц логарифмов и отметке, что первичные страницы намного больше изношены и размазаны, чем более поздние (Newcomb 1881). В то время как закон Бенфорда, несомненно, применим к нескольким ситуациям в мире, удовлетворительное объяснение было дано лишь недавно в работе Хилла (1998).

Закон Бенфорда был использован персонажем Чарли Эппсом как аналогия для помощи в раскрытии серии ограблений в рамках второго сезона “Бегущего человека” эпизода (2006) телевизионной криминальной драмы NUMB3RS.

Закон Бенфорда распространяется на данные, не являющиеся безразмерными, поэтому численные значения информации зависят от единиц измерения. Если существует универсальное распределение вероятностей P(x) по таким числам, то оно должно быть инвариантным при изменении масштаба, поэтому

P(kx)=f(k)P(x).

(1)

Если intP(x)dx=1, то intP(kx)dx=1/k, а нормализация подразумевает f(k)=1/k. Дифференцирование со ссылкой на k и установка k=1 дает

xP^'(x)=-P(x),

(2)

имеющий решение P(x)=1/x. Хотя это часто не является правильным распределением вероятностей (поскольку оно расходится), и законы физики, и человеческая конвенция накладывают отсечения. Например, случайно выбранные уличные адреса подчиняются чему-то на грани закона Бенфорда.

BenfordsLaw

Если между срезами лежит много степеней 10, то вероятность того, что первичная (десятичная) цифра D дается логарифмическим распределением

P_D=(int_D^(D+1)P(x)dx)/(int_1^(10)P(x)dx)=log_(10)(1+1/D)

(3)

для D=1, …, 9, проиллюстрирована выше и представлена в виде таблицы ниже.

D P_D D P_D

1 0.30103 6 0.0669468

2 0.176091 7 0.0579919

3 0.124939 8 0.0511525

4 0.09691 9 0.0457575

5 0.0791812

Однако закон Бенфорда применяется не только к масштабируемым данным, но и к числам, выбранным из множества различных источников. Объяснение этого факта требует более тщательного исследования центральных предельных теорем для мантисс случайных величин при умножении. так как число переменных увеличивается, функция плотности приближается к аналогичной функции вышеуказанного логарифмического распределения. Хилл (Hill, 1998) неукоснительно продемонстрировал, что “распределение распределений”, заданное случайными выборками, взятыми из распределения различных распределений, на самом деле является законом Бенфорда (Matthews).

Одним из ярких примеров закона Бенфорда является 54 миллиона реальных констант в базе данных “Обратного символьного калькулятора” Плауффа, 30% из которых начинаются с цифры 1. Принимая данные из нескольких разрозненных источников, в таблице ниже показано распределение первых цифр, скомпилированных Бенфордом.

заголовок 1 2 3 4 5 6 7 8 9 образцы

А Реки, Площадь 31,0 16,4 10,7 11,3 7,2 8,6 5,5 4,2 5,1 335

B Население 33,9 20,4 14,2 8,1 7,2 6,2 4,1 3,7 2,2 3259

C Константы 41,3 14,4 4,8 8,6 10,6 5,8 1,0 2,9 10,6 104

D Газеты 30,0 18,0 12,0 10,0 8,0 6,0 6,0 5,0 5,0 100

E Удельная теплота 24,0 18,4 16,2 14,6 10,6 4,1 3,2 4,8 4,1 1389

F давление 29,6 18,3 12,8 9,8 8,3 6,4 5,7 4,4 4,7 703

G H.P. Потеряно 30,0 18,4 11,9 10,8 8,1 7,0 5,1 5,1 3,6 690

Эйч Мол. Wgt. 26.7 25.2 15.4 10.8 6.7 5.1 4.1 2.8 3.2 1800

I Дренаж 27,1 23,9 13,8 12,6 8,2 5,0 5,0 2,5 1,9 159

J Атомные рт. 47,2 18,7 5,5 4,4 6,6 4,4 3,3 4,4 5,5 91

K n^(-1), sqrt(n) 25.7 20.3 9.7 6.8 6.6 6.8 7.2 8.0 8.9 5000

L Дизайн 26.8 14.8 14.3 7.5 8.3 8.4 7.0 7.3 5.6 560

M Ридерз Дайджест 33,4 18,5 12,4 7,5 7,1 6,5 5,5 4,9 4,2 308

N Данные о расходах 32,4 18,8 10,1 10,1 9,8 5,5 4,7 5,5 3,1 741

O рентгеновский вольт 27,9 17,5 14,4 9,0 8,1 7,4 5,1 5,8 4,8 707

Пэм. Лига 32,7 17,6 12,6 9,8 7,4 6,4 4,9 5,6 3,0 1458

Q Блэкбоди 31,0 17,3 14,1 8,7 6,6 7,0 5,2 4,7 5,4 1165

R адреса 28,9 19,2 12,6 8,8 8,5 6,4 5,6 5,0 5,0 342

S n^1, n^2…n! 25.3 16.0 12.0 10.0 8.5 8.8 6.8 7.1 5.5 900

T Смертность 27,0 18,6 15,7 9,4 6,7 6,5 7,2 4,8 4,1 418

В среднем 30,6 18,5 12,4 9,4 8,0 6,4 5,1 4,9 4,7 1011

Вероятная ошибка +/-0.8 +/-0.4 +/-0.4 +/-0.3 +/-0.2 +/-0.2 +/-0.2 +/-0.3

В следующей таблице приводится распределение первой цифры мантиссы по Закону Бенфорда с использованием ряда различных методов.

метод Последовательность ОЭИС

Сент-Лига A055439 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 9, …

д’Хондт A055440 1, 2, 1, 3, 1, 4, 2, 5, 1, 6, 3, 1, …

наибольший остаток, квоты на заработка A055441 1, 2, 3, 4, 1, 5, 6, 7, 1, 2, 8, 1,…

наибольшее оставшееся, Квоты A055442 1, 2, 3, 1, 4, 5, 6, 1, 2, 7, 8, 1, …