Pravděpodobnost a školy uvažování

Matematika |

Znovu: Máme tři karty. Jedna je z obou stran bílá, jedna z obou stran červená a jedna má červenou a bílou stranu. Vezmeme z balíčku náhodně jednu kartu a vyhodíme ji. Dopadne červenou stranou nahoru... Jaká je pravděpodobnost, že šlo o oboustranně červenou kartu? Vyberte si řešení (a třeba odpovídající školu), které vám více vyhovuje.




Článek, od něhož se odvíjí tento příspěvek:

Hrátky s kartami (plus následná diskuse)

Vzhledem k určitým potížím s formátováním zde na webu článek ve formátu ODT (OpenOffice.org)

Pravděpod.odt

Po konverzi do formátu DOC

Pravděpodnost.doc

Školy uvažování a pravděpodobnost

Úloha 1

Máme tři karty. Jedna je z obou stran bílá, jedna z obou stran červená a jedna má červenou a bílou stranu. Vezmeme z balíčku náhodně jednu kartu a vyhodíme ji. Dopadne červenou stranou nahoru…

Jaká je pravděpodobnost, že šlo o oboustranně červenou kartu?

K svému překvapení jsem z informací na Internetu zjistil, že se jedná o hlubší než jen psychologický problém, který může dokonce mít i různá řešení. Vyberte si řešení (a třeba odpovídající školu), které vám více vyhovuje.

Objektivistická škola

Tuto školu lze charakterizovat jako ortodoxní, objektivistickou, nebo také frekvencionistickou.

Přívlastek „frekvencionistická“ vyjadřuje, že pravděpodobnost je chápána jako limitní relativní četnost (frekvence) výskytu daného jevu v případě neomezeného opakování pokusu.

Přívlastek „objektivistická“ vyjadřuje, že pravděpodobnost je považována za objektivní údaj (chápaný frekvencionisticky) charakterizující daný náhodný pokus. Také vyjadřuje odmítání postupů vedoucích k „subjektivnímu“ stanovení pravděpodobnosti.

Podmíněnou pravděpodobnost používanou už Thomasem Bayesem považuje tato škola za odvozený pojem, který lze pomocí nepodmíněné pravděpodobnosti definovat.

Přívlastek „ortodoxní“ vyjadřuje principiální trvání na dodržování objektivistických principů a odmítání postupů, které se těchto principů důsledně nedrží.

Toto je v současnosti hlavní proud nejčastěji zastoupený ve výuce pravděpodobnosti i v literatuře.

Hlavní výhradou objektivistů vůči bayesiánům jsou námitky vůči subjektivitě stanovení pravděpodobnosti.

Pro stanovení pravděpodobnosti jevu A lze podle objektivistické školy postupovat takto:

1 Stanovíme množinu všech možných výsledků

2 Ověříme, že možných výsledků je konečný počet.

3 Ověříme, že všechny možné výsledky se vzájemně vylučují.

4 Ověříme, že všechny výsledky jsou objektivně stejně možné, tj. že máme informaci, která potvrzuje, že tyto výsledky by v případě neomezeného opakování limitně nastaly ve stejném počtu případů.

5 Zjistíme počet možných výsledků příznivých jevu A. Abychom získali pravděpodobnost jevu A tento počet vydělíme celkovým počtem možných výsledků.

Pro úplnost dodávám, že toto byl také způsob (daný mým vzděláním), který jsem pro řešení úlohy použil a tímto se omlouvám všem diskutujícím, že jsem až později narazil na publikaci E.T. Jaynese zmíněnou níže a nevěnoval proto pozornost diskusním příspěvkům naznačujícím možnost alternativního přístupu.

Naivní pokus o řešení

Jev A spočívá v tom, že karta, kterou po provedení pokusu vidíme, je oboustranně červená.

1 Za možné výsledky považujeme:

1.1 karta, kterou po provedení pokusu vidíme, je oboustranně červená

1.2 karta, kterou po provedení pokusu vidíme, má bílou spodní stranu

2 Získali jsme dva možné výsledky, což jsou skutečně všechny možné výsledky za předpokladu, že karta dopadne červenou stranou nahoru, jak je v zadání uvedeno.

3 Výsledky se vzájemně vylučují.

4 Tento bod záměrně vynecháme.

5 Počet možných výsledků příznivých jevu A je 1, hledaná pravděpodobnost je tedy ½.

Kde je chyba? Ta spočívá v záměrném vynechání bodu 4. V případě, že tento bod nevynecháme, musíme konstatovat, že informaci, která potvrzuje, že výše uvedené výsledky jsou objektivně stejně pravděpodobné, nemáme.

Řešení úlohy

1. Za možné výsledky považujeme tyto:

a. vybrali jsme oboustranně červenou kartu a ta dopadla svou první červenou stranou nahoru

b. vybrali jsme oboustranně červenou kartu a ta dopadla svou druhou červenou stranou nahoru

c. vybrali jsme bílo-červenou kartu a ta dopadla červenou stranou nahoru

2. Získali jsme tři možné výsledky, což jsou všechny možné výsledky za předpokladu, že karta dopadne červenou stranou nahoru, jak je v zadání uvedeno.

3. Výsledky se vylučují.

4. Výraz „náhodně“ neumožňuje pravděpodobnosti stanovit („náhodně“ může být i tak, že pravděpodobnosti se budou zásadním způsobem lišit). Výsledkem striktně ortodoxního postupu by proto podle mého názoru mělo být konstatování, že kvůli neznalosti pravděpodobností úlohu řešit nemůžeme.

Poznámka: i v ortodoxní škole lze použít o něco tolerantnější způsob. Jedná se o výklad výrazu „vezmeme jednu kartu“. Tento výraz se používá v případech, kdy naznačuje stejnou možnost výběru kterékoliv z karet. Pokud se k této interpretaci přikloníme, dospějeme ke stejnému výsledku jako u správného řešení bayesiánské školy, které je popsáno níže.

Bayesiánská škola

Tato škola je charakterizována přívlastky „bayesiánská“, „subjektivistická“, nebo také „induktivní“.

Za nejzajímavější pokládám slovo „induktivní“, kterým se zdůrazňuje, že tato škola považuje teorii pravděpodobnosti za zobecnění logiky. Logika je teorií deduktivního uvažování, čili odvozování poznatků na základě úplné informace. Teorie pravděpodobnosti je bayesiány považována za teorii induktivního uvažování, tj. uvažování na základě informace, která může být i neúplná. Teorie pravděpodobnosti podle této školy zahrnuje logiku jako speciální případ, pro který pravděpodobnosti zkoumaných jevů jsou buď rovny nule nebo jedné, tj. existuje o nich úplná informace.

Přívlastek „bayesiánská“ vyjadřuje, že za základní tato škola považuje Thomasem Bayesem navržený pojem podmíněné pravděpodobnosti P(A|B), tj. pravděpodobnost jevu A v případě, že víme, že nastal jev B. Jedním ze základních pravidel je Bayesovo pravidlo pro počítání s podmíněnými pravděpodobnostmi.

Je zajímavé, že teorie pravděpodobnosti v bayesiánském pojetí dokáže pravidla pro počítání s pravděpodobnostmi odvodit z několika požadavků konzistence a shody s běžně přijatelnými zásadami induktivního uvažování.

Pravděpodobnost je podle této školy „subjektivní“ v tom smyslu, že závisí na znalostech subjektu, který ji počítá. Pravděpodobnost totiž podle bayesiánů není limitní relativní četností výskytu nějakého jevu, ale mírou plauzibility (věrohodnosti). Příkladem může být úvaha soutěžícího v televizní hře otevírání schránek. Pokud je mu známo, že v jedné ze tří schránek je částka 3 000 Kč, zatímco ostatní schránky jsou prázdné, ale bližší podrobnosti nezná, určí pro každou schránku pravděpodobnost 1/3, že schránka obsahuje peníze. Moderátor hry, pokud ví, ve které schránce peníze jsou, přidělí pravděpodobnost 1 té schránce, ve které jsou peníze, zatímco pro ostatní schránky stanoví nulovou pravděpodobnost. I přes částečně subjektivní charakter výpočtu pravděpodobnosti není tento přístup nekonzistentní. V našem příkladu je pro soutěžícího pravděpodobnost, že v první schránce jsou peníze, popsána výrazem P(A1|H1), kde jev A1 znamená „v první schránce jsou peníze“, zatímco H1 znamená „peníze jsou v jedné ze schránek“. Konferenciér použije pravděpodobnost P(A1|H2), kde H2 znamená například: „peníze jsou v druhé schránce“. Je zcela konzistentní, že P(A1|H1) není rovno P(A1|H2).

I bayesiánské pojetí umožňuje objektivní přístup, i když poněkud jiného druhu než u ortodoxních objektivistů. Rovnost P(A1|H1) = P(A1|H1) lze totiž interpretovat tak, že dva lidé (nebo třeba stroje) se stejnými informacemi musí objektivně dospět ke stejné pravděpodobnosti, pokud používají pravidla induktivního uvažování správně.

Není bez zajímavosti, že Pierre Simon Laplace považovaný za zakladatele teorie pravděpodobnosti je rovněž považován za příslušníka bayesiánské školy. Za významného moderního představitele školy je považován Edwin Thompson Jaynes, viz např. jeho publikaci http://bayes.wustl.edu/etj/science.and.engineering/science.pdf , ze které jsem čerpal.

Hlavní výhradou bayesiánů vůči ortodoxnímu přístupu je, že objektivisté ke škodě věci chtějí zakázat některé legitimní postupy induktivního uvažování, takže existují úlohy, které není možné v rámci ortodoxního přístupu řešit i přesto, že se jedná o úlohy založené na induktivním uvažování. Pokud se výsledek získaný metodami objektivistů liší od výsledku získaného bayesiánskými metodami, mají bayesiáni za to, že v takovém případě ortodoxní postup nepoužil všechna pravidla induktivního uvažování a tudíž je použitý postup v rozporu s některým z těchto pravidel.

Druhou výhradou bayesiánů vůči objektivistům je, že podmíněnou pravděpodobnost P(A|B) nelze odvodit z nepodmíněné pravděpodobnosti pokud P(B) = 0, čili podmíněná pravděpodobnost nemůže být v teorii pravděpodobnosti odvozeným pojmem.

Třetí výhradou bayesiánů vůči objektivistům je, že limitní relativní četnost je pouze myšlenková konstrukce postrádající objektivitu, protože žádný pokus nelze opakovat donekonečna.

Pro stanovení pravděpodobnosti jevu A lze podle bayesiánské školy postupovat takto:

1 Stanovíme množinu všech možných výsledků

2 Ověříme, že možných výsledků je konečný počet.

3 Ověříme, že všechny možné výsledky se vzájemně vylučují.

4 Použijeme princip bezrozdílnosti (také indiference), který říká, že možným výsledkům musíme přidělit pravděpodobnosti, které vyjadřují míru bezrozdílnosti (indiference, neurčitosti, entropie) plynoucí z nám známých informací. V případě, že možných výsledků je n a informace, které máme, vyžadují jejich maximální bezrozdílnost, jsou odpovídající pravděpodobnosti P(Vi|X) = 1/n, kde Vi je i-tý z možných výsledků a X je poznatek „výsledky V1, V2, …, Vn jsou bezrozdílné (maximálně neurčité)“.

5 Pro výpočet pravděpodobnosti jevu A sečteme pravděpodobnosti možných výsledků příznivých jevu A.

Naivní pokus o řešení

Jev A spočívá v tom, že karta, kterou po provedení pokusu vidíme, je oboustranně červená.

1 Za možné výsledky považujeme tyto:

1.1 karta, kterou po provedení pokusu vidíme, je oboustranně červená

1.2 karta, kterou po provedení pokusu vidíme, má bílou spodní stranu

2 Získali jsme dva možné výsledky, což jsou skutečně všechny možné výsledky za předpokladu, že karta dopadne červenou stranou nahoru, jak je v zadání uvedeno.

3 Výsledky se vylučují, protože není možné, aby byla karta oboustranně červená a současně z jedné strany bílá.

4 Každému z možných výsledků, přidělíme „bezrozdílnou“ pravděpodobnost ½.

5 Jev A je ekvivalentní tomu, že nastane první možný výsledek, pravděpodobnost jevu A je tedy rovna pravděpodobnosti tohoto výsledku, čili ½.

Kde je chyba? Ta spočívá v nesprávném postupu v bodu 4. K tomu, že vidíme kartu ležící červenou stranou nahoru jsme dospěli určitým postupem, který je nám známý (byla vybrána a následně hozena jedna ze tří daných karet). Pravděpodobnost možných výsledků je nutno vypočítat tak, aby tato informace byla zohledněna.

Je nesprávné použít bezmyšlenkovitou bezrozdílnost nevycházející ze známých informací.

Řešení úlohy

1 Za možné výsledky považujeme:

1.1 byla vybrána oboustranně červená karta a ta dopadla první červenou stranou nahoru

1.2 byla vybrána oboustranně červená karta a ta dopadla druhou červenou stranou nahoru

1.3 byla vybrána bílo-červená karta a ta dopadla červenou stranou nahoru

1.4 byla vybrána bílo-červená karta a ta dopadla bílou stranou nahoru

1.5 byla vybrána oboustranně bílá karta a ta dopadla první bílou stranou nahoru

1.6 byla vybrána bílá karta a ta dopadla druhou bílou stranou nahoru

2 Získali jsme celkem šest možných výsledků, což jsou všechny možné výsledky výběru a hodu karty.

3 Výsledky se vzájemně vylučují.

4 Tak, jako v případě objektivistického přístupu, ani zde slovo „náhodně“ neumožňuje stanovit pravděpodobnosti. Zajímavější je formulace „vezmeme jednu kartu“, která znamená, že výběr karty není blíže specifikován. Pokud má zadání dávat smysl, nezbývá, než hledat řešení, které bude k různým možným způsobům výběru karty přistupovat bezrozdílně. Všimněme si, že tato bezrozdílnost není dána nějakým univerzálním principem, který by vyžadoval vždy a všude postupovat bezrozdílně, ale plyne ze symetrie, kterou jsme našli v zadání. Bezrozdílnost vůči výběru karty znamená, že pravděpodobnosti výběru karty budeme považovat za maximálně neurčité (bezrozdílné). Podobně jsme na tom s informací o způsobu hodu. Zde také není blíže určeno, jaké má hod mít vlastnosti, proto nám nezbývá, než hledat řešení, které k různým možným hodům bude přistupovat bezrozdílně, čili předpokládat, že dopad karty kteroukoliv její stranou vzhůru je stejně pravděpodobný. Odtud už dostáváme, že P(Vi|X) = 1/6, kde Vi je i-tý z uvedených možných výsledků a X je informace o bezrozdílnosti výběru a hodu karty.

5 Pokud označíme písmenem A jev, že vybereme oboustranně červenou kartu, pak P(A|X) = P(V1|X) + P(V2|X) = 2/6 = 1/3. Pokud označíme písmenem B jev, že vybraná karta dopadne červenou stranou nahoru, pak P(B|X) = P(V1|X) + P(V2|X) + P(V3|X) = 3/6 = ½. Víme, že P(B|A) = 1 (je jisté, že oboustranně červená karta dopadne červenou stranou nahoru).

Použijeme Bayesova vzorce, což je základní induktivní odvozovací pravidlo a dostaneme:


Řešením úlohy je tedy pro bayesiány konstatování, že hledaná pravděpodobnost je 2/3.

Úloha 2

Nádoba obsahuje 100 bílých a černých kuliček. Stokrát jsem z nádoby náhodně vytáhl kuličku a zase ji tam vrátil. Všechny vytažené kuličky byly bílé. Jaká je pravděpodobnost, že v nádobě jsou jen bílé kuličky?

Podobně jako v úloze číslo 1 není dána objektivní informace umožňující stanovení pravděpodobnosti, takže úlohu neumíme řešit ortodoxně.

Bayesiánské řešení

Zadání mírně pozměníme: „Obdržel jsem nádobu obsahující 100 kuliček, z nichž některé byly bílé a některé černé. Stokrát jsem z nádoby náhodně vytáhl kuličku a zase ji tam vrátil. Všechny vytažené kuličky byly bílé. Jaká je pravděpodobnost, že v nádobě jsou jen bílé kuličky?“

První důležitou symetrií (bezrozdílností) obsaženou v zadání je, že dvě nádoby obsahující stejný počet bílých kuliček jsou z pohledu popsaného experimentu stejné.

Jako příklad této symetrie stačí uvést, že pro provedení experimentu s nádobou obsahující 50 bílých kuliček je celkem jedno, zda byly do nádoby nejdříve vloženy všechny bílé kuličky a poté všechny černé, či zda tak někdo učinil třeba „napřeskáčku“.

Podle počtu bílých kuliček rozdělíme nádoby do 101 kategorií. Nechť B0, B1, …, B100 znamená: „v nádobě je 0, 1, …, 100 bílých kuliček“.

Druhou důležitou symetrií je symetrie, kterou je obtížnější odhalit, protože v zadání vlastně „není“. V zadání totiž chybí údaj, zda při převzetí nádoby přebírající má informaci o tom, kolik bílých kuliček by v nádobě mohlo být. Má-li mít úloha smysl, musíme předpokládat, že tato informace není v zadání uvedena úmyslně a že úlohu musíme řešit za předpokladu „přebírající nemá vůbec žádnou informaci o počtu bílých kuliček v nádobě“.

Nyní už máme pohromadě všechny symetrie, které k vyřešení úlohy potřebujeme. Symbolem X označíme informaci o existenci obou odhalených symetrií.

Naivní přístup

Nejdříve zkusme posoudit přístup „naivního bayesiána“ odvozujícího „maximálně bezrozdílné“ pravděpodobnosti P(Bi|X) z předpokladu, že kuličky byly do nádoby vkládány po jedné, přičemž vkládající si pokaždé hodil korunou a podle výsledku hodu vložil do nádoby buď bílou, nebo černou kuličku. Našemu „naivnímu bayesiánovi“ dáme zapravdu v tom, že použil „maximálně bezrozdílnou metodu“ pro vkládání jednotlivých kuliček do nádoby, tj. docílil toho, že neurčitost barvy právě vkládané kuličky je nejvyšší možná. Problémem našeho naivního kolegy ale je, že ignoroval už první symetrii, která říká, že při daném zadání je úplně jedno, v jakém pořadí byly kuličky do nádoby vkládány, takže nemá valný smysl se o bezrozdílnost tohoto druhu snažit. Kromě toho náš naivní kolega vyjde velmi špatně z konfrontace s druhou symetrií, protože jeho metoda vkládání má za následek velmi nízkou hodnotu P(B100|X) i P(B0|X) a velmi vysokou hodnotu P(B50|X). Pokud bychom předpokládali, že kuličky byly do nádoby vkládány touto metodou, pak by se o nás rozhodně nedalo říct, že „nemáme informaci o počtu bílých kuliček v nádobě“.

Řešení

Použitím druhé symetrie zjistíme, že pravděpodobnosti vyjadřující maximální neurčitost toho, která z možností B0, B1, …, B100 nastala jsou: P(Bi|X) = 1/101.

Symbolem A označíme, že jsme stokrát z nádoby vytáhli kuličku a zase ji tam vrátili, přičemž všechny vytažené kuličky byly bílé.

P(A|Bi) lze jednoduše určit:


.

Bayesovy vzorce dávají:


a také:


Z těchto vzorců vychází, že P(B100|A) je přibližně 0,636.

Paradox dvou obálek

S bayesiánským uvažováním souvisí následující paradox, který je téměř nezajímavý pro frekvencionistickou školu. (Frekvencionistická pravidla jsou natolik striktní, že je zřejmé, co frekvencionistická škola „zakazuje“ a co ne.)

U paradoxu dvou obálek se jedná o problém, jak podle bayesiánské školy zjistit, zda výpočet střední hodnoty náhodné veličiny je správný. Podívejme se tedy na první zadání:

Zadání 1

Na stole jsou dvě obálky. V jedné obálce je zvolená částka zatímco ve druhé obálce je dvojnásobek zvolené částky. K obálkám přijde soutěžící neznající zvolenou částku a jednu z obálek si vybere. Je pro soutěžícího výhodné vyměnit svou obálku za druhou z obálek bez toho, že by se do obálky podíval?

Protože se jedná o technický problém, úvahy si zjednodušíme tím, že budeme předpokládat, že soutěžící nemá žádnou averzi vůči riziku, tj. vždy si vybere tu alternativu, která mu zajistí nejvyšší střední hodnotu získané částky. Kromě toho přidáme standardní předpoklad, že zvolená částka je kladná.

Zvolenou částku si označme jako Z. Částku v obálce, kterou si soutěžící vybral, si označme jako X, částku ve druhé obálce jako Y.

Postup 1

E(X) = 1/2*Z + 1/2*2*Z = 3/2*Z

E(Y) = 1/2*Z + 1/2*2*Z = 3/2*Z

Z těchto vzorců plyne, že E(X) = E(Y), tj. je jedno, zda soutěžící obálku vymění, nebo ne.

Postup 2

Zřejmě X > 0

Jsou jen dvě možnosti, Y = 1/2*X, nebo Y = 2*X, přičemž každá z nich má pravděpodobnost ½.

E(Y) = 1/2*(1/2*X) + 1/2*(2*X) = 5/4*X > X, čili je výhodnější obálky vyměnit.

Postup 3

Zřejmě Y > 0

Jsou jen dvě možnosti, X = 1/2*Y, nebo X = 2*Y, přičemž každá z nich má pravděpodobnost ½.

E(X) = 1/2*(1/2*Y) + 1/2*(2*Y) = 5/4*Y > Y, čili je výhodnější obálky nevyměnit.

Protože každý z postupů dává jinou odpověď při stejných informacích, musí být alespoň dva z nich nesprávné.

Abychom nalezli chyby, kterých jsme se dopustili, nezbývá, než probrat uvedené postupy podrobněji.

Postup 1 – oprava

Názvem Z1 si označíme informaci ze zadání1. Protože zvolená částka je pro soutěžícího neznámá, přičemž se může nanejvýš s určitou pravděpodobností domnívat, že nabývá určité hodnoty, musí soutěžící částku Z považovat za náhodnou veličinu. Chyba, kterou jsme udělali, spočívá v tom, že do vzorce pro výpočet střední hodnoty jsme chybně dosadili náhodnou veličinu, místo abychom tam dosadili čísla. Pokud si písmenem z označíme hodnotu, která je v okamžiku rozhodování hodnotou náhodné veličiny Z, zjistíme, že správný vzorec je:

E(X) = P(X = Z|Z = z Z1)*z + P(X = 2*Z|Z = z Z1)*2*z

E(Y) = P(Y = Z|Z = z Z1)*z + P(Y = 2*Z|Z = z Z1)*2*z

V zadání úlohy není napsáno, do které z obálek byla vložena zvolená částka a do které z obálek byl vložen její dvojnásobek. Proto nás zajímá takové řešení, které je vůči této informaci symetrické. Po uplatnění principu bezrozdílnosti z toho plyne, že P(X = Z|Z = z Z1) = P(X = 2*Z|Z = z Z1) = P(Y = Z|Z = z Z1) = P(Y = 2*Z|Z = z Z1) = ½. Celkem tedy máme:

E(X) = 3/2*z

E(Y) = 3/2*z

, což opět vyjadřuje, že je jedno, zda soutěžící obálku vymění.

Původní postup výpočtu však byl až příliš zjednodušený a proto chybný, i když dospěl ke stejnému závěru.

Postup 2 – oprava

Písmenem x si označíme hodnotu, kterou má náhodná veličina X v okamžiku rozhodování. Vychází:

E(Y) = P(X = 2*Z|X = x)*1/2*x + P(X = Z|X = x)*2*x

Víme, že P(X = 2*Z|X = x) + P(X = Z|X = x) = 1, protože jedna z možností (X = Z, X = 2*Z) nastat musí, jak plyne ze zadání. V zadání však neexistuje symetrie, kvůli které by tyto dvě možnosti měly být bezrozdílné (což by vedlo k tomu, že P(X = 2*Z|X = x) = P(X = Z|X = x) = ½). Pro příklad, kdy tyto možnosti bezrozdílné nebudou viz např. zadání3, které je se zadáním1 kompatibilní (jedná se o zadání1 doplněné o další informace). Pokud bychom tuto bezrozdílnost i přesto předpokládali, dopustili bychom se podobného omylu jako v případě naivního řešení úlohy1, protože bychom symetrii, kterou jsme v zadání našli, nahradili jinou, která v něm není.

Výpočet podle postupu2 odpověď na otázku v zadání nedává.

Zadání 2

Na stole jsou dvě obálky. V jedné obálce je zvolená částka zatímco ve druhé obálce je dvojnásobek zvolené částky. K obálkám přijde soutěžící neznající zvolenou částku a jednu z obálek si vybere. Poté se může na obsah vybrané obálky podívat. Je pro soutěžícího výhodné vyměnit svou obálku za druhou z obálek?

Podle postupu1 je jedno, zda soutěžící obálku vymění. Podle postupu2 názor změnit nemůže, protože k tomu nemá dostatek informací.

Zadání 3

Zvolenou částku vylosujeme pomocí hodu korunou a to tak, aby pokud padne panna byla zvolena částka 1000, v opačném případě částka 2000. Ostatní informace jsou stejné, jako v zadání2. Soutěžící informaci o způsobu volby částky obdrží, i když neobdrží údaj, která částka byla zvolena.

V tomto případě má soutěžící po otevření obálky více informací, takže např. zjistí, že se mu vyplatí vyměnit obálku v případě, že v ní nalezne částku 1000 (částka ve druhé obálce je 2000) nebo 2000 (střední hodnota částky ve druhé obálce je 2500). Pokud v obálce nalezne 4000, výměna obálek se nevyplatí (částka ve druhé obálce je 2000).

Zkusme vyřešit jiný zdánlivý paradox v následujícím zadání.

Zadání 4

Platí totéž, co v zadání3, až na to, že každou z obálek dostane do rukou jiný soutěžící a každý soutěžící má právo se do své obálky podívat. Jaká je v takovém případě optimální strategie soutěžícího?

Pokud žijí oba soutěžící ve společné domácnosti, pak je jedno, jestli si obálky vymění, protože do společné domácnosti získají v obou případech stejnou částku rovnající se X + Y, takže ani nepotřebují počítat střední hodnotu.

Pokud hrají soutěžící „proti sobě“, pak je optimální strategií nabídnout protihráči výměnu jen pokud P(X = Z|X = x) = 1. (Snadno totiž zjistíme, že žádná jiná strategie tuto strategii ve střední hodnotě neporazí.) Jiná věc je, že rozumný protihráč v uvedeném případě s výměnou souhlasit nebude, takže k výměně nikdy nedojde.

Shrnutí

Při řešení úloh bayesiánskými metodami je nutno si dávat pozor na:

1. použití principu bezrozdílnosti – vždy je nutno tento princip aplikovat tak, aby aplikace byla v souladu se známými informacemi

2. výpočet střední hodnoty – nedosazovat do vzorce náhodné veličiny

3. výpočet střední hodnoty – dosazovat do vzorce správné pravděpodobnosti

Poděkování

Děkuji gigantům Thomasi Bayesovi, Pierre Simonu Laplaceovi a Edwinu Thompsonovi Jaynesovi, že mi umožnili stát na svých ramenou.

Děkuji také čtenáři, který dočetl až sem za jeho pozornost a zájem a doufám, že výše uvedená pravidla a postupy mu pomohou správně vyřešit co nejvíce problémů.








Související články




Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.