Prehľadávanie multimediálneho obsahu

Prehľadávanie multimediálneho obsahu je asi jedným z najefektívnejších využití rozpoznávania reči. Vďaka automatickému rozpoznaniu textu nahrávok a ich indexácii získavate prístup k informáciám obsiahnutým v nahrávke bez toho, aby ste ju museli celú počúvať. To je obrovská výhoda najmä v dnešnej dobe, keď býva informácií a nahrávok, ktoré možno prehľadávať, oveľa viac než času, ktorý možno tejto činnosti venovať. Ak máte k dispozícii takto spracovaný archív nahrávok, už ich nemusíte všetky počúvať, ani nemusíte svoje prehľadávanie obmedzovať na kusé informácie vo forme manuálne priradených kľúčových slov. Naopak, môžete najsť aj informáciu, ktorá sa v danej nahrávke vyskytuje len okrajovo a podľa kľúčových slov by teda nebolo možné ju dohľadať.

Jazyková časť

Táto technológia kombinuje rozpoznávač reči s fulltextovým vyhľadávaním doplneným jazykovými nástrojmi na tvaroslovné vyhľadávanie, prípadne synonymickým slovníkom alebo dokonca prekladačom. Možno ju kombinovať aj s hlasovým vyhľadávaním, čím vzniká systém, ktorý nielen vyhľadáva v reči, ale navyše je rečou i ovládaný.

Programové riešenie

Ako asi pri všetkých efektívne pracujúcich vyhľadávacích systémoch prebehne na prehľadávaných záznamoch najprv indexácia a následne je možné v nich efektívne vyhľadávať s využitím vytvorených indexov.

Kľúčovým komponentom tejto technológie je rozpoznávač reči, ktorý prevádza zvuk na text (v prípade nejednoznačného výsledku rozpoznávania môže byť i text nejednoznačný). Po ňom prichádza na rad spracovanie textu pred indexáciou (vytvorením registra - indexu), napríklad lemmatizácia (prevedenie slova na základný tvar) pre tvaroslovné vyhľadávanie, prípadne preklad do jazyka indexu, a konečne vlastné zanesenie do indexu, v ktorom vyhľadávací stroj následne vyhľadáva podľa zadaných dopytov. Dopyty sa tiež spracúvajú, môže prebiehať napríklad lemmatizácia alebo expanzia tvarov (k jednému tvaru slova sa doplnia aj všetky jeho ostatné tvary, aby se našli aj výskyty týchto tvarov, nielen zadaného tvaru), prípadne expanzia synoným alebo preklad do jazyka indexu.

Rozpoznávač je pomerne náročný na výpočtové prostriedky a jeho výpočtový výkon treba stanoviť tak, aby bol schopný dostatočne rýchlo prevádzať novo indexované záznamy na text. Čas potrebný na spracovanie záznamu je zlomkom času na jeho prehratie normálnou rýchlosťou. Vyšší počet jadier umožňuje spracovávať viac záznamov paralelne. Pre vyššiu záťaž je vhodné umiestěňenie rozpoznávačov na špeciálne dedikované servery s vyhovujúcimi parametrami. Ostatné činnosti pri indexácii sú podstatne rýchlejšie. Pre vyhľadávanie môže byť pri veľkej záťaži obmezujúcim faktorom rýchlosť čítania z disku. Toto je možné riešiť napríklad využitím rýchlych diskov, najlépšie SSD, alebo ich zrkadlením na ďalšie disky, prípadne ďalšie vyhľadávacie servery.