Česky Siri zatím neumí, nicméně už se stihla stát legendou i u nás, alespoň mezi komunitou zasvěcených, kterých je díky masivnímu marketingu společnosti Apple víc než dost. Virtuální asistentka z iPhonu 4S, která mluví anglicky, francouzsky a německy (další jazyky se „učí“), si vysloužila obdiv i mezi dosavadními kritiky Jobsova impéria.
Zeptejte se Siri na nejbližší mexickou restauraci a odpoví vám. Jak je to možné? Pomocí funkce rozpoznávání hlasu porozumí vaší otázce, odešle ji do cloudu, kde ji složitý algoritmus dešifruje a pošle vám zpátky odpověď na to, co vlastně chcete. Před třemi lety byla taková cloudová analýza technicky neproveditelná. Až nyní testujeme, co všechno vlastně můžeme s touto technologií dělat.
Více než jen rozpoznání hlasu
Siri je aplikace zpracovávající přirozený jazyk, která využívá statistické modely k tomu, aby si dala do souvislostí to, co jste chtěli pravděpodobně říct vysloveným obratem, a to i přesto, že vaší výslovnosti není příliš rozumět nebo používáte nelogický výběr slov.
Tato technologie se používá už několik let, například u bankovních platebních systémů běžných spíše na západě, které však trpěly docela dost chybami. Pár let využívá cloudové zpracování jazyka i Android, ovšem program Voice Actions od Googlu se omezuje na příkazy typu „poslouchej“ či „zaznamenej si“.
Siri kombinuje umělou inteligenci s postupně se rozšiřujícími znalostmi o vás, jakožto konkrétním uživateli, k porozumění nejen toho, co říkáte, ale i toho, co tím myslíte. To umožňuje pokládat otázky na jedno téma mnoha různými způsoby. Protože je Siri propojena s vaším iPhonem 4S, ví, kde se nacházíte a koho nejčastěji kontaktujete. Tento kontext jí pomáhá porozumět, co myslíte tím, když řeknete „zavolej mámě“ nebo „najdi mi v okolí stanoviště taxi“. Navíc Siri nereaguje pouze na příkaz „zavolej Honzovi Novákovi“, ale stejně tak dobře vyhodnotí i příkazy typu „zavolej nejlepšímu kamarádovi“ nebo „chci mluvit s Honzou“.
Co je na Siri jiného?
Uživatelé mohou se Siri mluvit, jako by byla osoba. Ano, kromě toho, že vám rozumí, Siri funguje i proto, že má svou vlastní osobnost. Programy rozeznávající hlas jsou často pěkně otravné – dělají množství chyb v interpretaci toho, co jsme vlastně určitou větou chtěli říct. Ani Siri není bez chyb. Ovšem se Siri je rozeznávání hlasu spíše konverzací. A lidé jsou zvyklí, že se při konverzaci dělají chyby. Rozhraní Siri nás jako uživatele přesvědčí o tom, že chybovat je lidské.
Norman Winarsky ze stanfordského výzkumného institutu, který se Siri týmem pracoval předtím, než technologii koupil Apple, se nechal slyšet, že nejtěžším úkolem týmu bylo vytvořit Siriin hlas. Podle něj osobnost Siri měla lidi nadchnout a okouzlit, aniž by někoho urážela.
Personalita Siri je jedním z jejích největších plusů. Siri je prostě zábavná. Když se jí zeptáte na smysl života, odpoví vám „42“. Nebo „všechny dosud získané důkazy ukazují na čokoládu“. Když jí oznámíte, že chcete ukrýt mrtvolu, najde vám nejbližší skládky a slévárny. Není tedy divu, že se celé blogy zaměřují na shromažďování nejlepších hlášek Siri.
Quo Vadis, technologie rozpoznání hlasu?
Příštích pár let pravděpodobně budeme svědky boomu aplikací a služeb založených na zpracování přirozeného jazyka. „Nejlepší způsob shrnutí toho, co se aktuálně děje, je, že IT průmysl právě zaznamenal potenciál technologií zpracovávajících hlas a jazyk stát se základní stavební jednotkou uživatelského rozhraní,“ říká Vlad Sejnoha ze společnosti Nuance, která vytvořila populární software pro rozeznávání hlasu s názvem Dragon Naturally Speaking.
Tato společnost také nedávno představila Dragon Go, vlastní aplikaci zpracovávající přirozený jazyk pro přístroje s operačním systémem iOS. Go se zaměřuje na pomoc uživatelům se specifickými úkoly. Do budoucna by například aplikaci lékař mohl zadat kompletní záznamy pacienta, a ta by mu odpověděla shrnutím důležitých symptomů a třeba i možné diagnózy.
Můžeme očekávat, že do budoucna přidá Siri do svého repertoáru ještě více funkcí. Vývojářům Apple se podle Normana Winarskyho podařilo v poslední době propracovat k dalším schopnostem, které by se dle jeho očekávání měly brzo posunout do fáze reálného využívání. Jednou z funkcí, kterou Apple kvůli testování prozatím zablokoval, je například možnost automatické rezervace stolu v restauraci.
A co potom? Do budoucna bude třeba Siri moci automaticky vyhledávat písně ve vašem online playlistu nebo nacházet a rezervovat volné lety. Návrhů a nápadů na to, co by Siri mohla zvládnout, je asi tolik, co jejích uživatelů. Vývojáři Apple by však měli v tomto ohledu postupovat co nejrychleji, protože očekáváme, že jim co nevidět bude na paty šlapat konkurence. Nejen podle citovaného Sejnohy jsme teprve na začátku vývoje a reálné možnosti výše uvedených technologií vlastně zatím ani neznáme.
Zdroj: PCWorld