Benfordův zákon: Jednička triumfuje nad ostatními číslicemi

Fyzika |

Vezměte nějaký soubor fyzikálních, respektive empiricky naměřených dat-čísel. Jaká je pravděpodobnost, že číslo náhodně vybrané z tohoto souboru bude začínat jedničkou?




***pravidelné páteční „přetištění“ staršího článku

Odpověď cca 1/9 kupodivu neplatí. Benfordův zákon říká, že jedničkou bude začínat zhruba 30 procent čísel, devítkou naopak méně než 5 procent. Zákon přesně řečeno tvrdí, že pravděpodobnost toho, že určité číslo začíná danou číslicí x, je rovna log (1+ (1/x)).

Kuriozně působící pravidlo se jmenuje podle amerického fyzika Benforda (zemřel 1948), ale již před ním si tohoto vztahu povšiml koncem 19. století S. Newcomb – a to na základě zjištění, podle kterého byly různé (např. logaritmické) tabulky používané tehdy k výpočtům přednostně ohmatány na prvních stranách, tedy u čísel začínajících na 1. Popravdě řečeno, rozdílná ohmatanost tabulek by se tedy určitě dala vysvětlit i jinak…

Zajímavé ale je, když se zamyslíme, proč vlastně Benfordův zákon platí a u dat jakého typu platí (nedá se podle něj sázet ani hádat dny v měsíci či telefonní čísla). Platnost není kupodivu omezena na fyzikální data, ale vztahuje se i na arbitrární systémy, takže se jím (údajně) řídí třeba ceny v supermarketech. Chovat se takto mají i účetní položky – při podvodech prý lidé často udělají chybu právě v tom, že se snaží, aby všechny číslice byly v jejich výkazech zastoupeny stejně často, tedy „náhodně“. Je ovšem jasné, že Benfordův zákon, tak jako veškerá statistická pravidla, bude u malého počtu čísel působit různou mírou rozmazaně.

Jak je to všechno vůbec možné? Někdy se odpověď zdá být nasnadě. Třeba u pořadových čísel domů v ulicích je jasné, že všechny ulice budou mít dům s číslem 1, řada ulic bude mít čísel méně než 20 atd. Pokud si vezmeme města s více než milionem obyvatel, pak je také jasné, že bude existovat více měst milionových než devítimilionových.

Podobně se řada dalších jevů v přírodě neřídí gaussovským rozdělením kolem nějaké střední hodnoty, ale mocninným (to proto ten logaritmus ve vzorečku výše) zákonem – „čím je věc větší, tím je jí méně“. Většina druhů vymře velmi rychle, jen velmi málo jich je dlouhověkých. Většina požárů spálí jen malé území, jen pár stojí skutečně za to. Atd.

Dá se ale obecně říci, co všechno musí soubor dat splňovat, aby pro něj Benfordův zákon platil? A nakolik je závislý na volbě jednotek? (Při kolísání veličiny kolem střední hodnoty by závislost zastoupení číslic na volbě jednotek byla evidentní, jak je tomu u benfordovských systémů?)











Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.