Ačkoli je filozofický základ Bayesovy věty překvapivě bohatý, její matematická formulace je úžasně jednoduchá. Ve své nejzákladnější podobě je to prostý algebraický výraz se třemi známými proměnnými a jednou neznámou. Tento jednoduchý vzorec nám však může neskutečně prohloubit chápání předpovědí.
Bayesova věta se týká podmíněné pravděpodobnosti. Uvádí tedy pravděpodobnost, s níž je daná teorie nebo hypotéza pravdivá, jestliže došlo k nějaké události.
Představte si, že žijete s partnerem a po návratu ze služební cesty objevíte v zásuvce komody kus cizího spodního prádla. Budete si pravděpodobně klást otázku: Jaká je pravděpodobnost, že vás partner podvádí? Podmínkou je váš nález spodního prádla; hypotézou, kterou byste rádi ohodnotili, je pravděpodobnost, že vás partner podvádí. Bayesova věta vám (věřte nebo ne) umí na takovou otázku odpovědět – pokud ovšem znáte (nebo jste ochotni odhadnout) tři veličiny:
Za prvé musíte odhadnout pravděpodobnost faktu, že by se u vás spodní prádlo objevilo, jestliže je hypotéza pravdivá – a partner vás tedy podvádí. Předpokládejme zde, že jste žena, váš partner je muž a ono spodní prádlo jsou dámské kalhotky. Pokud vám je nevěrný, je jistě velice jednoduché si představit, jak se tam kalhotky dostaly. Jenže na druhou stranu, i když (a možná právě proto, že) vás podvádí, asi byste čekali, že bude opatrnější. Stanovme tedy pravděpodobnost nálezu kalhotek v důsledku jeho nevěry na 50 %.
Za druhé je potřeba odhadnout pravděpodobnost skutečnosti, že se tam spodní prádlo objevilo, jestliže je hypotéza nepravdivá. Pokud vám není nevěrný, existují nějaké nevinné důvody, jak by se k vám cizí kalhotky mohly dostat? Určitě ano, i když ne všechny jsou příjemné (mohly by to být jeho kalhotky). Možná došlo k záměně zavazadel. Mohlo by se také stát, že u vás zcela nevinně přespala jeho kamarádka, které důvěřujete. Ony kalhotky by také mohly být dárek pro vás, který váš partner zapomněl zabalit. Žádná z těchto teorií není sama o sobě nemyslitelná, přestože některé hraničí s výmluvami typu „nemám domácí úkol, protože mi ho sežral pes“. Dohromady jim přidělíte pravděpodobnost 5 %.
Za třetí – a to je nejdůležitější – potřebujete takzvanou apriorní pravděpodobnost. Jakou pravděpodobnost byste přisoudili jeho nevěře předtím, než jste ono spodní prádlo objevili? Může být samozřejmě obtížné být v této věci naprosto objektivní, když už teď o kalhotkách víte. (Ideální je stanovovat apriorní pravděpodobnost před zkoumáním důkazů.) Někdy je však možné takový údaj odhadnout empiricky. Studie například zjistily, že v jakémkoli daném roce svého manžela či manželku podvádějí asi čtyři procenta vdaných či ženatých osob, takže si tuto hodnotu vezmeme jako svou apriorní pravděpodobnost.
Když už jsme odhadli tyto hodnoty, můžeme aplikovat Bayesovu větu, abychom stanovili aposteriorní pravděpodobnost. O tento údaj nám jde – jak pravděpodobná je partnerova nevěra, jestliže jsme objevili ony dámské kalhotky? Výpočet (a jednoduchý algebraický výraz, který k němu vede) je na obrázku 8-3 /tičtěného vydání knihy/.
Ukázalo se, že je tato pravděpodobnost pořád docela nízká: 29 %.
Může vám to připadat nelogické – copak ty kalhotky nejsou dostatečným důkazem? Výsledek je ale především důsledkem skutečnosti, že jste jeho nevěře přiřadili nízkou apriorní pravděpodobnost. Přestože má nevinný muž méně věrohodných vysvětlení objevu kalhotek než ten vinný, vy jste se na počátku domnívali, že je nevinný, a to má v celé rovnici velkou váhu.
Je-li naše apriorní přesvědčení silné, dokáže být překvapivě odolné i ve světle nových důkazů. Klasickým příkladem tohoto jevu je výskyt rakoviny prsu u žen mezi čtyřicátým a padesátým rokem života. Pravděpodobnost rakoviny prsu u čtyřicátnic je naštěstí poměrně nízká – asi 1,4 %. Jaká je ale pravděpodobnost nemoci, jestliže výsledek jejího vyšetření na mamografu byl pozitivní?
Podle studií naznačí mamograf u žen, které rakovinu nemají, nesprávně přítomnost nemoci pouze asi v 10 % případů. Pokud naopak rakovinu mají, odhalí ji asi v 75 % případů. Při pohledu na tuto statistiku vám bude pozitivní výsledek skutečně připadat jako velice nepříjemné zjištění. Pokud však tyto hodnoty dosadíte do Bayesovy věty, dospějete k odlišnému závěru: pravděpodobnost, že má žena mezi čtyřicátým a padesátým rokem života rakovinu prsu, jestliže měla pozitivní výsledek mamografického vyšetření, činí stále jen asi 10 %. V rovnici dominují falešně pozitivní výsledky, protože jsme vyšli z předpokladu, že má rakovinu prsu jen velmi málo mladých žen. Z těchto důvodů mnoho lékařů doporučuje, aby ženy začaly na pravidelná vyšetření prsou chodit až po padesátce, kdy je už apriorní pravděpodobnost rakoviny prsu vyšší.
Tento text je úryvkem z knihy:
Silver Nate: Signál a šum. Většina předpovědí selže. Některé ne
Paseka 2014
O knize na stránkách vydavatele
Poznámka: Silver je znám především svou velice přesnou prognózou výsledků posledních amerických voleb.