Portál AbcLinuxu, 3. května 2025 17:35
DeepQA je technologie IBM, která v tomto roce dokázala porazil člověka v americké televizní soutěži Jeopardy! (obdoba českého Riskuj!). V této inkarnaci dostalo DeepQA lidštější pojmenování, a to IBM Watson. Pojďme se ale podívat na historii projektu a to, jakým způsobem pracuje.
Práce IBM na umělé inteligenci (AI) rozhodně nezačaly s DeepQA. Předchůdcem DeepQA byl počítač Deep Blue, který v roce 1997 dokázal porazit 2:1 Garryho Kasparova v šachách. Pravda, bylo to až po upgradu nazývaném někdy také „Deeper Blue“, protože v roce 1996 to byl Kasparov, kdo vyhrál. Na tehdejší dobu ani nešlo o nijak zázračně výkonný superpočítač, neboť v žebříčku TOP500 byl až na 259. místě. A ani software samotný nebyl postavený na zcela převratných základech – hlavním principem pro hledání nejlepšího kroku byla hrubá síla. Už v této době, kdy se výrobci procesorů předháněli spíš v megahertzích než počtech jader, ale našla své využití masivní paralelizace.
Deep Blue byl po své výhře rozebrán, a to navzdory tomu, že Kasparov odmítal svou prohru uznat. Přišlo mu, že se počítač někdy choval příliš inteligentně, což považoval za známku podvádění – podvádění v tom smyslu, že místo počítače rozhodoval o tazích i člověk. Zmiňme ale, že ani Deep Blue nebyl první v řadě: jeho předchůdci byly počítače ChipTest (rok 1985), Deep Thought (1989) a Deep Thought 2 (1991). Ty ale žádného velkého šachistu neporazily.
Na DeepQA ale byly kladeny mnohem větší požadavky. Jednoúčelový software hrající šachy má docela snadný život. Pracuje nad konečným a dobře definovaným prostorem, existuje jen omezené množství možných tahů a hra je založena na jasně dané sadě pravidel. Analýza lidského jazyka je mnohem tvrdší oříšek. Jazyk má tendenci být nejednoznačný, nemá přesně daný matematický základ a stejnou myšlenku lze vyjádřit obrovským množstvím způsobů.
Počítač dokáže na exaktní otázku odpovědět velmi rychle, pokud má k dispozici exaktní data. V lidské řeči nemá počítač ani jedno. Software proto musí hledat vodítka, jež dokážou najít souvislost mezi otázkou a hledanými informacemi – někdy jsou to vodítka jednoznačná (světlo a forma energie), jindy jsou zase naprosto vágní (přijal jsem to – to -> ?). Této analýze pochopitelně předchází větný rozbor, přesněji hledání podmětu, přísudku a předmětu. Software tedy musí pracovat odlišně, než kdyby analyzoval klíčová slova jen jako webový vyhledávač.
Vědci z IBM měli v průběhu své práce k dispozici informace o správnosti odpovědí soutěžících a jejich jistotě odpovědí (zde se spíše vycházelo z toho, jestli odpověděli, nebo ne). Díky tomu mohli objektivně porovnávat, jak si aktuálně vede umělá inteligence. Ještě v roce 2007 nebyly výsledky příliš přesvědčivé, ale tehdy se společnost rozhodla zabrat a rychle se přiblížit člověku. A už po roce se čísla rychle zlepšila. Další úsilí pak dovedlo Watsona až k vítězství.
O konkrétních postupech Watsona v soutěži Jeopardy! si povíme příště.
DeepQA je postavené na modulárním principu za pomoci Unstructured Information Management Architecture (Architektura správy nestrukturovaných informací), což není žádný utajený projekt – více najdete na stránkách Apache UIMA. Ke zpracování dat se používá další open source projekt, a to Apache Hadoop. A protože na Watsonových serverech běžel Linux, můžeme tak říci, že základem pro úspěch Watsona byl právě open source.
IBM ale samozřejmě nepracuje na DeepQA kvůli prémii z televizní soutěže. Watson byl ověřením funkčnosti technologie v praxi a současně veřejnou demonstrací, aby lidé uvěřili, co už dokáže software (na výkonném hardwaru). Jeden takový Watson se tak může dostat i do vaší firmy, neboť Watson byl postaven na komerčně dostupných serverech Power 750. Server Power 750 Express je osazen jednou až čtyřmi procesorovými paticemi a podporuje až 32 procesorových jader. Jednoprocesorovému serveru by ale odpověď v soutěži trvala hodiny; snadné škálování pak umožnilo snížit potřebný čas na sekundy.
Tato architektura najde využití v oblastech jako určování diagnóz u pacientů nebo například na telefonní podpoře – pokud Watson dokázal porazit nejschopnější hráče v Jeopardy!, není obtížné si představit, že předčí průměrného pracovníka helpdesku. Ve firmách může DeepQA být použito i v rámci Business intelligence.
Abychom si to shrnuli, mezi hlavní zásady architektury DeepQA patří:
Více o DeepQA naleznete na webových stránkách IBM US.
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.