DeepQA – technologie, která obehrála člověka

DeepQA je technologie IBM, která v tomto roce dokázala porazil člověka v americké televizní soutěži Jeopardy! (obdoba českého Riskuj!). V této inkarnaci dostalo DeepQA lidštější pojmenování, a to IBM Watson. Pojďme se ale podívat na historii projektu a to, jakým způsobem pracuje.

Obsah

Předchůdci DeepQA

Práce IBM na umělé inteligenci (AI) rozhodně nezačaly s DeepQA. Předchůdcem DeepQA byl počítač Deep Blue, který v roce 1997 dokázal porazit 2:1 Garryho Kasparova v šachách. Pravda, bylo to až po upgradu nazývaném někdy také „Deeper Blue“, protože v roce 1996 to byl Kasparov, kdo vyhrál. Na tehdejší dobu ani nešlo o nijak zázračně výkonný superpočítač, neboť v žebříčku TOP500 byl až na 259. místě. A ani software samotný nebyl postavený na zcela převratných základech – hlavním principem pro hledání nejlepšího kroku byla hrubá síla. Už v této době, kdy se výrobci procesorů předháněli spíš v megahertzích než počtech jader, ale našla své využití masivní paralelizace.

Deep Blue byl po své výhře rozebrán, a to navzdory tomu, že Kasparov odmítal svou prohru uznat. Přišlo mu, že se počítač někdy choval příliš inteligentně, což považoval za známku podvádění – podvádění v tom smyslu, že místo počítače rozhodoval o tazích i člověk. Zmiňme ale, že ani Deep Blue nebyl první v řadě: jeho předchůdci byly počítače ChipTest (rok 1985), Deep Thought (1989) a Deep Thought 2 (1991). Ty ale žádného velkého šachistu neporazily.

Rodí se DeepQA

Na DeepQA ale byly kladeny mnohem větší požadavky. Jednoúčelový software hrající šachy má docela snadný život. Pracuje nad konečným a dobře definovaným prostorem, existuje jen omezené množství možných tahů a hra je založena na jasně dané sadě pravidel. Analýza lidského jazyka je mnohem tvrdší oříšek. Jazyk má tendenci být nejednoznačný, nemá přesně daný matematický základ a stejnou myšlenku lze vyjádřit obrovským množstvím způsobů.

Počítač dokáže na exaktní otázku odpovědět velmi rychle, pokud má k dispozici exaktní data. V lidské řeči nemá počítač ani jedno. Software proto musí hledat vodítka, jež dokážou najít souvislost mezi otázkou a hledanými informacemi – někdy jsou to vodítka jednoznačná (světlo a forma energie), jindy jsou zase naprosto vágní (přijal jsem to – to -> ?). Této analýze pochopitelně předchází větný rozbor, přesněji hledání podmětu, přísudku a předmětu. Software tedy musí pracovat odlišně, než kdyby analyzoval klíčová slova jen jako webový vyhledávač.

Vědci z IBM měli v průběhu své práce k dispozici informace o správnosti odpovědí soutěžících a jejich jistotě odpovědí (zde se spíše vycházelo z toho, jestli odpověděli, nebo ne). Díky tomu mohli objektivně porovnávat, jak si aktuálně vede umělá inteligence. Ještě v roce 2007 nebyly výsledky příliš přesvědčivé, ale tehdy se společnost rozhodla zabrat a rychle se přiblížit člověku. A už po roce se čísla rychle zlepšila. Další úsilí pak dovedlo Watsona až k vítězství.

DeepQA mimo soutěžní svět

DeepQA je postavené na modulárním principu za pomoci Unstructured Information Management Architecture (Architektura správy nestrukturovaných informací), což není žádný utajený projekt – více najdete na stránkách Apache UIMA. Ke zpracování dat se používá další open source projekt, a to Apache Hadoop. A protože na Watsonových serverech běžel Linux, můžeme tak říci, že základem pro úspěch Watsona byl právě open source.

IBM ale samozřejmě nepracuje na DeepQA kvůli prémii z televizní soutěže. Watson byl ověřením funkčnosti technologie v praxi a současně veřejnou demonstrací, aby lidé uvěřili, co už dokáže software (na výkonném hardwaru). Jeden takový Watson se tak může dostat i do vaší firmy, neboť Watson byl postaven na komerčně dostupných serverech Power 750. Server Power 750 Express je osazen jednou až čtyřmi procesorovými paticemi a podporuje až 32 procesorových jader. Jednoprocesorovému serveru by ale odpověď v soutěži trvala hodiny; snadné škálování pak umožnilo snížit potřebný čas na sekundy.

Tato architektura najde využití v oblastech jako určování diagnóz u pacientů nebo například na telefonní podpoře – pokud Watson dokázal porazit nejschopnější hráče v Jeopardy!, není obtížné si představit, že předčí průměrného pracovníka helpdesku. Ve firmách může DeepQA být použito i v rámci Business intelligence.

Diskuse k tomuto článku

Watson místo pracovníka helpdesku? Třeba u O2? No to by byla paráda, i kdyby nic neuměl, stejně by na této pozici exceloval, a hned by byl pracovníkem měsíce :)

Nicméně jako marketingový tah by to nemuselo býti špatné.

8.11.2011 13:53 tdvorak
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka

že bychom si s robotem popovídali nejen před zahájením hovoru, ale i během něj :-)

8.11.2011 17:35 Xerces
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka

O2 jde ale preci opacnym smerem. Vsude cpou ze ted uz se na automat nedovolate!

8.11.2011 23:34 aaaaaaa
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka

Watsona ako pracovnika helpdesku si viem predstavit napr. v T-Come. Tam by snad nieco aj poradil, neslo by len o otazku "Aky mate OS?" s tym, ze po lubovolnej odpovedi nastupuje univerzalna rada restartovat a zavolat za chvilu.