Google při skenování knih zapojí i infračervené kamery

Aktuality | 12.05.2009

Projekt Googlu, v rámci kterého chce společnost digitalizovat maximum knih a umožnit v nich vyhledávat on-line, naráží na jeden problém. Nástroje pro rozpoznávání textu (OCR) totiž potřebují 2D obrázek a na místech, která jsou blízko k vazbě, dochází k chybám. Google se nyní pokouší tento problém obejít. V USA byl společnosti udělen patent číslo 7508978. Pomocí dvojice kamer snímajících v infračervené oblasti se vytvoří 3D model stránky a tím se stanoví míra a způsob „narušení“ textu. Poté je provedena příslušná korekce a až její výsledek se předhodí programu OCR.

Google se v rámci svého projektu snaží zajistit přístup jak ke knihám, které se již neprodávají, tak i k dílům současným. V nich by bezplatně mělo být možné pouze vyhledávat, nikoliv mít přístup k plné verzi textu.

Zdroj: New Scientist

O právních problémech projektu Google Book Search a jejich řešení jsme psali také v článku Google se dohodl s autory i vydavateli.

autor Pavel Houser