Ačkoliv přeformulování dat do řeči četností výrazně pomůže, podmíněné pravděpodobnosti mohou být záludné i z jiných důvodů. Je snadné položit si špatnou otázku a vypočítat sice správnou pravděpodobnost, ale chybně ji interpretovat.
(dokončení včerejšího úryvku)
V procesu s O. J. Simpsonem v letech 1994–95 se v tomto směru prohřešily jak obžaloba, tak i obhajoba. Obě strany požádaly soud, aby přihlédl ke špatně zvoleným podmíněným pravděpodobnostem.
Obžaloba předkládala po prvních deset dnů procesu důkazy, že Simpson má za sebou dlouhou historii násilného chování ke své bývalé manželce Nicole Brownové. Údajně ji bil, opakovaně jí mrštil o zeď a osahával ji na veřejnosti, přičemž divákům říkal: „Tohle je moje vlastnictví.“ Ale co mělo tohle všechno společného s obviněním z vraždy? Argument žaloby byl, že násilné chování k manželce odráží touhu ji zabít. Jak jeden z žalobců řekl: „Políček je předzvěstí vraždy.“
Alan Dershowitz za obhajobu namítl, že i kdyby obvinění z domácího násilí byla pravdivá, jsou nepodstatná a neměla by být připuštěna. Později napsal: „Věděli jsme, že kdyby bylo třeba, můžeme to dokázat, protože jen nepatrná část – podstatně méně než 1 z 2 500 mužů, kteří udeří nebo bijí svou partnerku, ji skutečně zabijí.“
V podstatě obě strany žádaly soud, aby vzal v úvahu pravděpodobnost, že muž zabije svou exmanželku, když ji předtím týral. Ale jak upozornil statistik I. J. Good, tato pravděpodobnost není relevantní.
Skutečná otázka zní: Jaká je pravděpodobnost, že muž zavraždil svou exmanželku, za předpokladu, že ji předtím bil a že byla žena někým zavražděna? Taková podmíněná pravděpodobnost vychází nepoměrně větší než 1 ku 2 500.
Abychom viděli proč, představme si vzorek 100 000 týraných žen. Použijeme-li Dershowitzův údaj 1 ku 2 500, můžeme očekávat, že 40 z těchto žen bylo zabito těmi, kdo je týrali (100 000 děleno 2 500). Kromě toho očekáváme, že v průměru další 3 ženy z původního počtu byly zabity někým jiným – to je odhad používající statistiku FBI o zavražděných ženách v roce 1992 (další podrobnosti naleznete v poznámkách.) Takže ze 43 zavražděných žen jich 40 zabili ti, kdo je týrali. Jinými slovy, týrající manžel je vrahem v 93 % případů.
Nezaměňujte ale toto číslo s pravděpodobností, že O. J. Simpson je vrah. Taková pravděpodobnost bude záviset na mnoha dalších důkazech pro i proti, třeba na tom, že (podle obhajoby) to policie na Simpsona narafičila, nebo že (podle obžaloby) měl vrah se Simpsonem stejný typ obuvi, stejné rukavice a stejnou DNA.
A jaká je pravděpodobnost, že tohle všechno změnilo váš názor na rozsudek? Nulová.
Tento text je úryvkem z knihy:
Steven Strogatz: Radost z x – Průvodce matematikou od jedné do nekonečna
Argo a Dokořán 2014
O knize na stránkách vydavatele
Komentáře
13.02.2015, 13:46
.... ñïñ çà èíôó....
11.02.2015, 10:55
.... ñýíêñ çà èíôó....
16.12.2014, 20:38
.... ñïàñèáî çà èíôó....
27.07.2014, 18:50
.... ñýíêñ çà èíôó!!...
13.05.2014, 20:43
[...] Jelikož celkem 70 + 7 = 77 žen má pozitivní nález na mamografu a jenom 7 z nich skutečně rakovinu má, je pravděpodobnost, že žena s rakovinou má pozitivní test 7 ze 77, což je 1 z 11 čili asi 9 %. Všimněme si dvou zjednodušení předchozího výpočtu. Za prvé místo s desetinnými čísly pracujeme – byť jen přibližně – s celými čísly. To se projevilo na několika místech, jako když jsme řekli: „Z těchto 8 žen s rakovinou prsu jich bude mít 7 pozitivní mamograf.“ Správně jsme měli říct 90 % z 8 žen, což je 7,2 žen – trochu přesnosti jsme obětovali ve prospěch jednoduchosti. Druhé zjednodušení je v tom, že předpokládáme, že všechno dopadne přesně tak, jak to pravděpodobnosti naznačují. Třeba, že když je pravděpodobnost rakoviny prsu 0,8 %, přesně 8 z 1 000 žen našeho vzorku ji má. To ve skutečnosti nemusí být pravda. Skutečné události nemusí přesně odpovídat pravděpodobnosti. Když hodíme 1 000krát mincí, nepadne vždy přesně 500krát panna. Ale počítáme-li, že ano, dostáváme v úlohách jako tato správnou odpověď. Přiznávám, že logika je při tomto přístupu maličko na vodě, což je taky důvod, proč na něj učebnice hledí skrz prsty ve srovnání s rigoróznějším, ale obtížněji použitelným Bayesovým teorémem – nicméně výhoda větší srozumitelnosti tento postup bohatě ospravedlní. Když Gigerenzer testoval dalších 24 lékařů a předložil jim data v podobě četností, téměř všichni odpověděli správně nebo skoro správně. (dokončení úryvku) [...]
Napsat vlastní komentář
Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.