Rozpoznání řeči plné šumu

Aktuality |

Firmy Phonexia a OptimSys z Jihomoravského inovačního centra uvedly na trh technologii přepisu spontánní telefonní řeči na text.




***tisková zpráva Jihomoravského inovačního centra

Systém umí zpracovat nekvalitní záznam signálu, okolní ruchy, šumy, nekvalitní vyslovování atd., což doposud žádný software pro češtinu neumožňuje. Tyto pokročilé funkce lze navíc implementovat do informačního systému firmy bez nutnosti nákupu nových telefonních přístrojů či nové telefonní ústředny. Technologie byla vyvinuta ve spolupráci s VUT v Brně.

Současné komerčně nasazené systémy přepisu řeči jsou vyvinuty především jako diktovací systémy omezené na konkrétní obor vyžadující kvalitní zvuk, mikrofon, minimum okolních ruchů při nahrávání, důslednou artikulaci atd. Přepis nekvalitních nahrávek telefonních hovorů na text s jejich pomocí je realizován s velmi nízkou úspěšností. Technologie vyvinutá společností Phonexia oproti tomu dosahuje 85 % úspěšnosti, což plně postačuje pro pochopení obsahu při čtení textu a umožňuje s ním dále pracovat např. při indexaci a vyhledávání, tvorbě obsahů řečových záznamů, kontrole obsahu telefonátu atd. Úspěšnost systému se stále zvyšuje zejména přidáváním slov do slovníku, základní verze obsahuje přes jeden milion slov.

Díky technologiím společnosti OptimSys lze tyto pokročilé funkce navíc snadno implementovat do informačního systému firmy bez nutnosti nákupu nových telefonních přístrojů či nové telefonní ústředny. Systém je vhodný jak pro běžné firmy kladoucí důraz na péči o zákazníky, tak pro provozovatele call-center či jiných subjektů s potřebou monitorování a dalšího zpracování telefonního provozu. Je vhodným rozšířením firemních telefonních systémů, CRM systémů či multimediálních archívů.

Až doposud bylo možné archivovat spontánní telefonní konverzaci pouze v podobě zvukových nahrávek, jež neumožňovaly další zpracování. Technologie společnosti Phonexia tento nedostatek odstraňuje a umožňuje pracovat s obsahem telefonátu v textové podobě. Technologie byla vyvinuta ve spolupráci s VUT v Brně. Firma OptimSys v rámci řešení dodává softwarovou platformu OptimTalk plně založenou na standardech umožňující mimo jiné nahrávat telefonní hovory a doručovat nahrávky k přepisu. Rovněž slouží jako platforma pro integraci telefonie s IT systémy. OptimTalk patří ve své kategorii mezi světovou špičku, díky čemuž umožňuje počítačové zpracování telefonní komunikace způsobem, který byl dříve jen obtížně realizovatelný. Vzniká tak unikátní celek, jenž zajišťuje snadné a rychlé začlenění přepsaných telefonátů do podnikového IT prostředí a podnikových procesů.

Nový revoluční systém mohou firmy využívat například pro pořízení záznamu z externích i interních jednání, telekonferencí aj. Umožňuje řeč vizuálně procházet a rychle získávat základní představu např. o směru a vývoji obchodního jednání nebo v řeči vyhledávat. Systém může být nepostradatelným pomocníkem i pro obchodní zástupce, kteří nemají čas mezi schůzkami pořizovat zápisky z jednání. Nově budou moci nadiktovat poznámky zavoláním na telefonní číslo, zvukovou nahrávku i přepis textu pak najdou v CRM systému pro další zpracování. Značné využití systém nabízí pro operátory call-center. Přepis telefonních hovorů operátorů na text poskytne nadřízenému jejich efektivnější kontrolu, např. zda operátor dodržuje stanovený scénář, jestli předal klientovi požadované informace atd. Systém umí také detekovat monitorovaná slova např. název konkurence nebo vulgarizmy použité jak ze strany klienta tak operátora. Praktické využití technologií je možné zdarma vyzkoušet na stránce www.PrepisReci.cz.

 „Výzkumná skupina BUT Speech@FIT pracující na Fakultě informačních technologií VUT se svými technologiemi rozpoznávání řeči už několikrát uspěla na celosvětové úrovni,“ říká doc. Jan Černocký, vedoucí ústavu počítačové grafiky a multimédií. „Nové technologie a výsledky našeho výzkumu přenáší společnost Phonexia pomocí dalšího vývoje do praxe. Tato spolupráce nám poskytuje cennou zpětnou vazbu, na kterou můžeme reagovat dalším aplikovaným výzkumem.“

„V oblasti extrakcí užitečných informací z mluvené řeči jsme už vyvinuli technologie pro identifikaci jazyka, rozpoznávání řečníka, určení pohlaví mluvčího nebo detekci klíčových slov v řečových záznamech. V rámci tohoto projektu jsme se ve spolupráci s VUT v Brně a firmou OptimSys zaměřili na vývoj nové technologie umožňující kompletní přepis spontánní hovorové řeči na text určený pro snadné komerční použití,“ uvádí Pavel Matějka, jednatel společnosti Phonexia.

 „V oblasti péče o zákazníky se ve světě začíná prosazovat nový trend dolování informací z řeči, především z telefonních hovorů, tzv. speech analytics,“ konstatuje Pavel Cenek, ředitel společnosti OptimSys. „Příslušné technologie v kombinaci s otevřenými standardy pro tvorbu telefonních a řečových aplikací tvoří zcela novou generaci telefonních systémů s unikátními funkcemi. V současné době se však v České republice používají téměř výhradně systémy předchozích generací, které námi nabízené funkce neumožňují. Naše společnost je jediným českým tvůrcem platformy pro telefonní a hlasové aplikace založené na výše zmíněných otevřených standardech.“








Související články




Komentáře

Napsat vlastní komentář

Pro přidání příspěvku do diskuze se prosím přihlašte v pravém horním rohu, nebo se prosím nejprve registrujte.