Projekt Googlu, v rámci kterého chce společnost digitalizovat maximum knih a umožnit v nich vyhledávat on-line, naráží na jeden problém. Nástroje pro rozpoznávání textu (OCR) totiž potřebují 2D obrázek a na místech, která jsou blízko k vazbě, dochází k chybám. Google se nyní pokouší tento problém obejít. V USA byl společnosti udělen patent číslo 7508978. […]
Projekt Googlu, v rámci kterého chce společnost digitalizovat maximum knih a umožnit v nich vyhledávat on-line, naráží na jeden problém. Nástroje pro rozpoznávání textu (OCR) totiž potřebují 2D obrázek a na místech, která jsou blízko k vazbě, dochází k chybám. Google se nyní pokouší tento problém obejít. V USA byl společnosti udělen patent číslo 7508978. Pomocí dvojice kamer snímajících v infračervené oblasti se vytvoří 3D model stránky a tím se stanoví míra a způsob „narušení“ textu. Poté je provedena příslušná korekce a až její výsledek se předhodí programu OCR.
Google se v rámci svého projektu snaží zajistit přístup jak ke knihám, které se již neprodávají, tak i k dílům současným. V nich by bezplatně mělo být možné pouze vyhledávat, nikoliv mít přístup k plné verzi textu.
Zdroj: New Scientist
O právních problémech projektu Google Book Search a jejich řešení jsme psali také v článku Google se dohodl s autory i vydavateli.
Komentáře
Napsat vlastní komentář
Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.