Tradiční digitální počítač se velice dobře hodí k řešení řady běžných úloh. Je docela rychlý a dělá přesně to, co mu řeknete. Naneštěstí vám nemůže pomoci, když vy sami docela přesně nerozumíte problému, který chcete řešit. A co je ještě horší, standardní algoritmy nepracují dobře s porušenými nebo nekompletními daty — jenže v reálném světě je právě toto často jediný dostupný druh dat. Řešením, které se zde nabízí, je použití umělé neuronové sítě (ANN), výpočetního systému, který se může sám učit.
Umělá neuronová síť (ANN, artificial neural network) je prostředkem pro zpracování komplexních dat, využívajícím ke své práci množství propojených procesorů a výpočetních cest. ANN jsou inspirovány architekturou lidského mozku; jsou schopny se učit a analyzovat rozsáhlé a komplexní množiny dat, které mnohem lineárnější algoritmy jen těžko zvládnou.
První umělou neuronovou síť vymyslel v roce 1958 psycholog Frank Rosenblatt. Byla nazvána Perceptron a smyslem její existence mělo být modelování postupu, při kterém lidský mozek zpracovává vizuální data a učí se rozeznávat objekty. Jiní badatelé používají od té doby podobné ANN sítě ke studiu lidského poznávání.
Posléze si někdo uvědomil, že kromě poskytování pohledů na fungování lidského mozku by mohly být ANN sítě užitečným nástrojem i samy o sobě. Jejich schopnost vytvářet vzorce a samy se jim učit umožňují postihnout mnoho problémů, které byly obtížné nebo zcela neřešitelné standardními výpočetními a statistickými metodami. Do konce 80. let začalo mnoho institucí v reálném světě používat ANN sítě pro rozličné účely. Ačkoliv jsou ANN sítě často nazývány prostě neuronovými sítěmi, je vhodné si uvědomit, že tento název mnohem spíše náleží biologickým mozkům, podle nichž byly původně modelovány.
Struktura
Umělá neuronová síť funguje tak, že vytváří spojení mezi mnoha různými procesními prvky, z nichž každý je analogický se samostatným neuronem v biologickém mozku. Tyto neurony mohou být fyzicky konstruovány nebo simulovány digitálním počítačem. Každý neuron dostává mnoho vstupních signálů. Poté, na základě vnitřního vyvažovacího systému, produkuje jednotlivý výstupní signál, který je typicky zasílán jako vstup jinému neuronu.
Neurony jsou těsně propojeny a organizovány do různých vrstev. Vstupní vrstva dostává vstupní údaje, výstupní vrstva vytváří finální výstup. Mezi tyto dvě vrstvy je obvykle vložena jedna nebo více skrytých vrstev. Tato struktura neumožňuje předvídat ani znát přesný tok dat.
Jak se učí
Umělé neuronová sítě typicky začínají s náhodnými váhami pro všechny své neurony. To znamená, že "nevědí" nic a musejí být školeny na řešení konkrétního problému, pro který byly zamýšleny. Při pohledu hodně ze široka lze říci, že existují dvě metody školení ANN v závislosti na problému, který musejí řešit. Samoorganizující se ANN (self-organizing ANN, často nazývaná podle svého tvůrce Kohonenova) je vystavována velkému množství dat a směřuje k odhalení zákonitostí a souvislostí v těchto datech. Badatelé často používají tento typ pro analýzu experimentálních dat.
Naopak zpětně šířící ANN (back-propagation ANN) je lidmi školena na vykonávání speciálních úloh. Během školicího období učitel vyhodnocuje, zda je výstup ANN správný. Pokud je správný, neuronové váhy, které tento výstup vytvářejí, jsou posíleny; pokud je výstup nesprávný, zodpovědné váhy jsou oslabeny. Tento typ je nejčastěji využíván pro poznávací výzkum a pro aplikace na řešení problémů.
Je-li implementována na jednom počítači, je umělá neuronová síť typicky pomalejší než tradičnější algoritmické řešení. Paralelní povaha ANN nicméně umožňuje, aby byla vytvořena pomocí mnoha procesorů, což jí dává výhodu velké rychlosti za velice nízkých nákladů na vývoj. Paralelní architektura také umožňuje ANN sítím efektivně zpracovávat velice rozsáhlé množiny dat. Když zacházejí s rozsáhlým, nepřetržitým proudem informací, jako je rozpoznávání řeči nebo data ze strojových čidel, mohou ANN sítě pracovat podstatně rychleji než jejich lineární protějšky.
Umělé neuronová sítě se ukázaly jako užitečné v rozmanitých aplikacích skutečného světa, které pracují s komplexními, často neúplnými daty. První z nich byly v oblasti rozpoznávání vizuálních předloh a rozpoznávání řeči. Kromě toho využívají ANN sítě také současné programy pro převod textu na hlas. Mnohé programy pro analýzu písma (i ty používané v populárních organizérech PDA) využívají právě ANN sítě.
Také automatizované a robotizované továrny jsou nyní často monitorovány ANN sítěmi, které kontrolují strojní zařízení, nastavují teplotu, diagnostikují funkční poruchy apod. ANN sítě mohou provádět skutečně kvalifikovanou práci, čímž snižují mzdové náklady a umožňují současným zaměstnancům firem udělat více práce.
Využití v ekonomické oblasti
Skutečně napínavým dobrodružstvím může být využití ANN sítí v ekonomické oblasti. Velké finanční instituce používají ANN sítě ke zlepšení výkonnosti v takových oblastech, jako je hodnocení obligací, úvěrové hodnocení (credit scoring), cílený marketing a hodnocení úvěrových žádostí. Tyto systémy jsou typicky pouze o několik procent přesnější než jejich předchůdci, ale protože se zde jedná o velké množství peněz, jsou velice rentabilní. ANN sítě jsou nyní také využívány pro analýzy transakcí s kreditními kartami, aby odhalovaly pravděpodobné případy podvodů.
Hodí se však i při odhalování dalších druhů kriminality. Detektory bomb na mnoha amerických letištích používají ANN sítě k analýze zavazadel na přítomnost výbušných chemikálií. A ještě jedna zajímavost na závěr: Personální oddělení chicagské policie používá ANN sítě k odhalení korupce mezi policejními úředníky.
Odkazy na Web
* Vysvětlení základních principů neuronových sítí i s řadou odkazů lze nalézt na webové stránce http://www.emsl.pnl.gov:2080/proj/neuron/neural/what.html
* Řadu produktů využívajících ke své činnosti neuronové sítě nabízí např. společnost NeuroDimension. Na jejích stránkách http://www.nd.com/ se dozvíte více o nasazení ANN v praxi.
* Stránky http://www.iit.nrc.ca/subjects/Neural.html nabízejí pohled do oblasti výzkumných projektů souvisejících s ANN