Portál AbcLinuxu, 3. května 2025 17:35

DeepQA – technologie, která obehrála člověka

8. 11. 2011 | Luboš Doležel
Články - DeepQA – technologie, která obehrála člověka  

DeepQA je technologie IBM, která v tomto roce dokázala porazil člověka v americké televizní soutěži Jeopardy! (obdoba českého Riskuj!). V této inkarnaci dostalo DeepQA lidštější pojmenování, a to IBM Watson. Pojďme se ale podívat na historii projektu a to, jakým způsobem pracuje.

Obsah

Předchůdci DeepQA

link

Práce IBM na umělé inteligenci (AI) rozhodně nezačaly s DeepQA. Předchůdcem DeepQA byl počítač Deep Blue, který v roce 1997 dokázal porazit 2:1 Garryho Kasparova v šachách. Pravda, bylo to až po upgradu nazývaném někdy také „Deeper Blue“, protože v roce 1996 to byl Kasparov, kdo vyhrál. Na tehdejší dobu ani nešlo o nijak zázračně výkonný superpočítač, neboť v žebříčku TOP500 byl až na 259. místě. A ani software samotný nebyl postavený na zcela převratných základech – hlavním principem pro hledání nejlepšího kroku byla hrubá síla. Už v této době, kdy se výrobci procesorů předháněli spíš v megahertzích než počtech jader, ale našla své využití masivní paralelizace.

Deep Blue byl po své výhře rozebrán, a to navzdory tomu, že Kasparov odmítal svou prohru uznat. Přišlo mu, že se počítač někdy choval příliš inteligentně, což považoval za známku podvádění – podvádění v tom smyslu, že místo počítače rozhodoval o tazích i člověk. Zmiňme ale, že ani Deep Blue nebyl první v řadě: jeho předchůdci byly počítače ChipTest (rok 1985), Deep Thought (1989) a Deep Thought 2 (1991). Ty ale žádného velkého šachistu neporazily.

Deep Blue

Rodí se DeepQA

link

Na DeepQA ale byly kladeny mnohem větší požadavky. Jednoúčelový software hrající šachy má docela snadný život. Pracuje nad konečným a dobře definovaným prostorem, existuje jen omezené množství možných tahů a hra je založena na jasně dané sadě pravidel. Analýza lidského jazyka je mnohem tvrdší oříšek. Jazyk má tendenci být nejednoznačný, nemá přesně daný matematický základ a stejnou myšlenku lze vyjádřit obrovským množstvím způsobů.

Počítač dokáže na exaktní otázku odpovědět velmi rychle, pokud má k dispozici exaktní data. V lidské řeči nemá počítač ani jedno. Software proto musí hledat vodítka, jež dokážou najít souvislost mezi otázkou a hledanými informacemi – někdy jsou to vodítka jednoznačná (světlo a forma energie), jindy jsou zase naprosto vágní (přijal jsem to – to -> ?). Této analýze pochopitelně předchází větný rozbor, přesněji hledání podmětu, přísudku a předmětu. Software tedy musí pracovat odlišně, než kdyby analyzoval klíčová slova jen jako webový vyhledávač.

DeepQA

Vědci z IBM měli v průběhu své práce k dispozici informace o správnosti odpovědí soutěžících a jejich jistotě odpovědí (zde se spíše vycházelo z toho, jestli odpověděli, nebo ne). Díky tomu mohli objektivně porovnávat, jak si aktuálně vede umělá inteligence. Ještě v roce 2007 nebyly výsledky příliš přesvědčivé, ale tehdy se společnost rozhodla zabrat a rychle se přiblížit člověku. A už po roce se čísla rychle zlepšila. Další úsilí pak dovedlo Watsona až k vítězství.

O konkrétních postupech Watsona v soutěži Jeopardy! si povíme příště.

DeepQA mimo soutěžní svět

link

DeepQA je postavené na modulárním principu za pomoci Unstructured Information Management Architecture (Architektura správy nestrukturovaných informací), což není žádný utajený projekt – více najdete na stránkách Apache UIMA. Ke zpracování dat se používá další open source projekt, a to Apache Hadoop. A protože na Watsonových serverech běžel Linux, můžeme tak říci, že základem pro úspěch Watsona byl právě open source.

IBM ale samozřejmě nepracuje na DeepQA kvůli prémii z televizní soutěže. Watson byl ověřením funkčnosti technologie v praxi a současně veřejnou demonstrací, aby lidé uvěřili, co už dokáže software (na výkonném hardwaru). Jeden takový Watson se tak může dostat i do vaší firmy, neboť Watson byl postaven na komerčně dostupných serverech Power 750. Server Power 750 Express je osazen jednou až čtyřmi procesorovými paticemi a podporuje až 32 procesorových jader. Jednoprocesorovému serveru by ale odpověď v soutěži trvala hodiny; snadné škálování pak umožnilo snížit potřebný čas na sekundy.

DeepQA

Tato architektura najde využití v oblastech jako určování diagnóz u pacientů nebo například na telefonní podpoře – pokud Watson dokázal porazit nejschopnější hráče v Jeopardy!, není obtížné si představit, že předčí průměrného pracovníka helpdesku. Ve firmách může DeepQA být použito i v rámci Business intelligence.

Abychom si to shrnuli, mezi hlavní zásady architektury DeepQA patří:

  1. Robustní paralelní procesy: Architektura provádí velký počet paralelních procesů vyhodnocujících pro různé interpretace a hypotézy.
  2. Velký počet odborníků: Architektura usnadňuje integraci, aplikaci a kontextové hodnocení široké škály volně propojených pravděpodobnostních otázek a analýzy kontextu.
  3. Všudypřítomná jistota odhadů: Odpověď nevychází pouze z jedné části obsahu; všechny části obsahu vytvářejí atributy a s tím spojenou jistotu a číselné hodnocení různých interpretací otázek a obsahu. Základním vyhodnocením jistoty se systém učí porovnávat a kombinovat skóre prognóz.
  4. Integrace obecných a detailních poznatků: Architektura zajišťuje rovnovážné využití přísné sémantiky a obecné sémantiky za pomoci řady volně zformovaných ontologií.

Více o DeepQA naleznete na webových stránkách IBM US.

Další články z této rubriky

Týden na ScienceMag.cz: Hubbleovo napětí by mohl vyřešit pomalu rotující vesmír
Týden na ITBiz: Halucinace balíčků při programování AI
Týden na ScienceMag.cz: Kvantová elektronika v křemíku a diamantu
Týden na ITBiz: DeepSeek nic nemění, umělá inteligence vyžaduje obrovské investice do cloudové infrastruktury
Týden na ScienceMag.cz: Komplexní modely AI prý zpochybňují Occamovu břitvu

Diskuse k tomuto článku

8.11.2011 12:58 petr
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka
Odpovědět | Sbalit | Link | Blokovat | Admin
Watson místo pracovníka helpdesku? Třeba u O2? No to by byla paráda, i kdyby nic neuměl, stejně by na této pozici exceloval, a hned by byl pracovníkem měsíce :)

Nicméně jako marketingový tah by to nemuselo býti špatné.
8.11.2011 13:53 tdvorak
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka
že bychom si s robotem popovídali nejen před zahájením hovoru, ale i během něj :-)
8.11.2011 17:35 Xerces
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka
O2 jde ale preci opacnym smerem. Vsude cpou ze ted uz se na automat nedovolate!
8.11.2011 23:34 aaaaaaa
Rozbalit Rozbalit vše Re: DeepQA – technologie, která obehrála člověka
Watsona ako pracovnika helpdesku si viem predstavit napr. v T-Come. Tam by snad nieco aj poradil, neslo by len o otazku "Aky mate OS?" s tym, ze po lubovolnej odpovedi nastupuje univerzalna rada restartovat a zavolat za chvilu.
9.11.2011 09:56 ..... Izak ..... | skóre: 14
Rozbalit Rozbalit vše Senior specilaista u M$
Odpovědět | Sbalit | Link | Blokovat | Admin
Exeloval by u M$, stacilo by znat znalostni bazi firmy, kterou neznaji ani specialisti a nejak rouzmne to analyzovat ... pak by asi radil dobre ;-)

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.