Potíže s randomizací – náhoda uniká

Matematika |

Prezident Richard Nixon 26. listopadu 1969 podepsal vládní nařízení, jímž pověřil odvodový úřad, aby pro odvody do Vietnamu stanovil nějakou náhodnou posloupnost výběru. Nařízení specifikovalo, že loterie bude založena na datech narození... Následky byly znepokojivé – mužům narozeným ve druhé polovině roku hrozila povážlivě vyšší pravděpodobnost, že budou odvedeni...




***pokračování včerejšího úryvku
Permutace optimalizují strategii výběru partnera

V roce 1970 Spojené státy odváděly za války ve Vietnamu formou loterie muže do armády.
Prezident Richard Nixon 26. listopadu 1969 podepsal vládní nařízení, jímž pověřil odvodový úřad, aby pro odvody stanovil nějakou náhodnou posloupnost výběru. Nařízení specifikovalo, že loterie bude založena na datech narození, žádné konkrétnější instrukce ohledně metody již ale nedávalo.
V historii to nebylo poprvé, kdy se měl odvod odehrát na základě nějakého druhu loterie. Zvláště zajímavé je v tomto ohledu biblické vyprávění o soudci Gedeónovi. Hospodin před střetem s Midjánci, kteří utiskovali Izraelce, nejprve izraelskému vůdci Gedeónovi řekl: „Je s tebou příliš mnoho lidu, než abych jim vydal Midjánce do rukou, aby se Izrael vůči mně nevychloubal: ´Vysvobodil jsem se vlastní rukou.´ Nuže, provolej teď k lidu: Kdo se bojí a třese, ať se z Gileádského pohoří vrátí a vzdálí.“ Vrátilo se tak dvaadvacet tisíc mužů a Gedeónovi k dispozici zůstalo deset tisíc.
Ve druhé fázi „loterie“ Hospodin přiměl Gedeóna uplatnit druhé výběrové kritérium a řekl mu, ať poručí mužstvu sestoupit k vodě a tam se napít. Vybrat pak měl k boji jen těch tři sta, kteří „si podávali vodu rukou k ústům“, a propustit všechny ostatní, kteří „chlemtali vodu jazykem jako pes a každého, kdo si při pití klekne na kolena“. Je zřejmé, že Gedeónova loterie měla daleko do náhodného výběru – řekli bychom, že ke všem možným permutacím souboru kandidátů se nepřistupovalo rovnocenně. Zvláštní druh výběru druhého kritéria má řadu interpretací. Nejjednodušší je ta, že to celé sloužilo jen k výběru malého počtu lidí, aby se vytvořil co největší dojem zázračného vítězství. Propracovanější vysvětlení dávají klekání na kolena do souvislosti s praktikami používanými při uctívání jiných bohů než izraelského a používání rukou (oproti pití přímo z proudu) pak označují za projev uvážlivosti a uměřenosti.
Zvláštní je, že ačkoli odvodová loterie pro rok 1970 probíhala o tisíce let později, i ona trpěla problémy s randomizací neboli simulací náhodného výběru.
Procedura sama o sobě byla vcelku jednoduchá. Úředníci vložili lístky se 366 dny roku (včetně 29. února) do tobolek na způsob míčků z někdejší televizní loterie Mates a 1. prosince 1969 byly tyto tobolky jedna za druhou taženy z mísy. Každému muži narozenému mezi lety 1944 a 1948 bylo přiděleno odvodové číslo odpovídající pořadí, v němž bylo taženo jeho datum narození. Například první tažené datum bylo 14. září, takže každý muž s tímto datem narození dostal číslo 1. Muži narození 8. června (poslední tažená tobolka) měli číslo 366. Je očividné, že každý tah představoval permutaci 366 dat narození. Čím bylo přidělené číslo menší, tím vyšší byla pravděpodobnost, že muž bude skutečně odveden. Níže uvedená tabulka ukazuje, jaká průměrná čísla vyšla v této loterii na jednotlivé měsíce:

měsíc průměrné číslo měsíc průměrné číslo
leden 201 červenec 182
únor 203 srpen 174
březen 226 září 157
duben 204 říjen 183
květen 208 listopad 149
červen 196 prosinec 122

Nemusíme být školenými statistiky, abychom poznali, že tato čísla vykazují jasný trend. Zatímco průměrná čísla pro měsíce leden až květen jsou vcelku stálá, dochází u čísel odpovídajících měsícům červen až prosinec ke zřetelnému a skoro pravidelnému snižování. Zejména listopad a prosinec vykazovaly značně nižší průměrná čísla než leden až květen. Následky byly znepokojivé – mužům narozeným ve druhé polovině roku hrozila povážlivě vyšší pravděpodobnost, že budou odvedeni do velmi nepříjemné války.
Při skutečně náhodném výběru by mělo každé z možných pořadí dat zcela stejnou pravděpodobnost jedna ku 366! (počet možných permutací); u průměrného čísla pro jednotlivé měsíce bychom očekávali zhruba stejné hodnoty, asi 183 nebo 184. Údaje ale ukazují, že průměrné číslo každého z prvních šesti měsíců bylo nad tímto ideálním průměrem a každý z posledních šesti měsíců byl pod ním. Statistici ukázali, že pravděpodobnost výskytu takového výsledku při skutečně náhodném výběru je menší než 1 ku 50 000. Jak k tomu vlastně došlo?
Důležité vodítko k řešení problému poskytuje popis celého postupu přípravy loterie:

Napočítali 31 tobolek a do nich vložili papírové lístky s lednovými daty. Lednové tobolky pak byly vloženy do velké hranaté dřevěné bedny a dělící příčkou odsunuty na stranu, takže část krabice zůstala prázdná. Do volného prostoru bedny pak byla vsypána a spočítána data únorová a ta pak byla dělicí příčkou přidána k lednovým datům. Podle kapitána Pascoea [šéf odboru veřejných informací odvodového úřadu] byly takto lednové a únorové tobolky důkladně promíchány. Stejně se postupovalo u každého následujícího měsíce, kdy se tobolky napočítaly do prázdného místa bedny a pak natlačily k tobolkám s předchozími měsíci. Lednové tobolky tak byly promíchány s ostatními pouzdry jedenáctkrát, únorové desetkrát, a tak dále. Listopadové byly zamíchány pouze dvakrát a prosincové už jen jednou … Tobolky pak byly vsypány před zraky veřejnosti z černé bedny do mísy hluboké asi 60 centimetrů. V míse se již tobolky nepromíchávaly … Osoby, které tobolky táhly … obvykle vybíraly z vrchu, ačkoli jednou za čas ponořily ruku doprostřed nebo na dno mísy.

Takto detailní zpráva nenechává na pochybách, že míchání bylo nedostatečné – tobolky byly umisťovány do bedny po jednotlivých měsících, což mělo za následek vznik rizika nenáhodného výsledku. Po veřejné kritice byl postup v odvodové loterii pro rok 1971 upraven. Je pravda, že dosáhnout dokonalé randomizace může být v praxi obtížnější, než by se dalo čekat.

Tento text je úryvkem z knihy
Mario Livio: Neřešitelná rovnice – Matematika a jazyk symetrií, Argo a Dokořán 2008, 320 stran, 100 ilustrací, 399 Kč
Podrobnosti na stránkách vydavatele








Související články




Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.