Portál AbcLinuxu, 5. května 2025 12:53

Jak se IBM Watson probojoval k vítězství

6. 12. 2011 | Luboš Doležel
Články - Jak se IBM Watson probojoval k vítězství  

Minule jsme se podívali na starší projekty, ze kterých nakonec vznikla technologie DeepQA, základní stavební kámen IBM Watson. Tentokrát se blíže podíváme na samotnou soutěž a vnitřní postupy, díky kterým Watson zvítězil v televizní soutěži nad člověkem.

Těžce vybojované vítězství

YouTube je plný videí, která předvádějí Watsona v akci. Vypadá to jako technologie z budoucnosti a je pravdou, že i výzkumníkům z IBM zpočátku připadalo nemožné něco takového vyvinout. Pouze díky píli a odhodlanosti se podařilo vyvinout lepšího hráče, než je člověk. Přesto však přiznávají, že forma soutěže Watsonovi nahrávala, zejména pak důraz na rychlost a skutečnost, že odpovědí je maximálně několik slov. Kdyby šlo o písemnou vědomostní soutěž, kde by bylo smyslem rozepsat co nejkvalitnější odpověď na zadanou otázku, pak by výsledné skóre vypadalo trochu jinak.

Dalším velkým milníkem v budoucnosti bude schopnost počítače vést dialog s člověkem – myšlen je plnohodnotný dialog, nikoliv jen jednoduché reakce různých programů „na pokec“. IBM to vidí tak, že za deset let by se mohlo podařit udělat průlom tímto směrem. Neméně lákavá by pak byla schopnost systému se dále samostatně rozvíjet a hledat doposud neznámé souvislosti mezi nabytými znalostmi.

Mnoho lidí zajímalo, zda by Watson dokázal pracovat i v jiném jazyce, pokud by se mu místo World Book Encyclopedia, anglické Wikipedie a dalších anglických zdrojů (jako například knihy ze svobodného Project Gutenberg) „podstrčily“ zdroje kupříkladu v němčině. Ano i ne. Algoritmy jako takové by fungovaly, nicméně by bylo nutné doplnit logiku pro daný jazyk. Watson totiž nehledá jen určitou relevanci jako vyhledávače, ale snaží se najít pomůcky, které mu poodhalí význam vět.

Analýza jazyka

Obecným základem pro analýzu významu vět je identifikace podmětu, přísudku a předmětu. Software se tak naučí základní poznatky jako „Voda je kapalina“. Neméně důležité jsou i další části vět – v soutěži Jeopardy! jde často o příslovečné určení času, program si tak může najít souvislost mezi letopočtem a informací o tom, kdo byl v danou dobu prezidentem.

Jak je vidět na následujícím obrázku, výzkumníci své algoritmy postupně zlepšovali. Výsledky porovnávali s výkonem hráčů soutěže – světle modré tečky jsou výsledky vítězů, červené jsou výsledky těch nejlepších. Při soutěži jde také o taktiku – software musí vyjádřit svou jistotu danou odpovědí a pokud je příliš nízká, vyplatí se neodpovídat než riskovat ztrátu bodů. Perličkou je, že výzkumníkům přišel při testování vhod i fanouškovský web, kde byly zveřejněny otázky a správné odpovědi v historii této televizní soutěže.

Watson - úspěšnost

Zapeklitost otázek (a lidské řeči vůbec) si můžeme snadno předvést. Například věta „Při premiéře filmu 60 minut byl tento člověk prezidentem“ obsahuje dva oddělené problémy. Watson musí větu rozdělit na dva oddělené problémy:

Dalším krokem je odhalit povahu otázky (Kdo byl prezidentem?) a určení, v jakém období se má hledat odpověď (premiéra filmu 60 minut). Jiným zajímavým příkladem, jak musí software hledat spojitosti jsou tyto dvě věty:

Software musí najít souvislost mezi oběma letopočty, musí vědět, že Kappad se nachází v Indii, musí si být vědom příbuznosti slov „dorazil“ a „připlutí“ a pak teprve získá (i když nejistou) představu o tom, že Vasco da Gama byl objevitelem.

Zrada se ovšem může nacházet v podobě této věty:

Čistě na základě výskytu podobných slov proto nejde dělat kvalitní závěry.

POWER7 přístupnějším

V říjnu 2011 byla řada systémů POWER7, na kterých Watson běžel při soutěži, rozšířena o modely Express. Ty zpřístupňují tento hardware i menším firmám. Nejobyčejnější variantou je „710 Express“ s frekvencí 3,7 GHz při 6 jádrech nebo 3,55 GHz při 8 jádrech. Nejnadupanějším modelem je 795 s až 256 jádry o frekvenci přesahující 4 GHz.

Dostupné jsou také blade servery s o něco slabší konfigurací než mají plnohodnotní sourozenci. Prvním komerčním nasazením technologie DeepQA na serverech POWER7 by měla být americká zdravotní pojišťovna WellPoint, kde bude software hledat souvislost nikoliv mezi letopočty a mořeplavci, nýbrž mezi příznaky u pacientů a diagnózou. Tato pojišťovna má 34 milionů pojištěnců. Mezi zásadní přednosti POWER7 patří:

Ani servery POWER7, ani technologie DeepQA nejsou pro běžné firmy něčím nedosažitelným. Díky modularitě je možné hardware i software přizpůsobit na míru konkrétním potřebám. Je tedy pravděpodobné, že doba, kdy Watson bude pomáhat řešit každodenní problémy i ve vaší firmě není vůbec daleko.

Další články z této rubriky

WEDOS Protection ochránil web před kyberútoky
Čarodějnice jsou pryč, kupte a čarujte s Windows 11 od Goodoffer24!
Nešlehejte vejce ale Windows 11 na Goodofer24 jen za €20.00!
Bláznivý Apríl, bláznivě nízké ceny Windows 11! Získejte jen za €20
Přehled k montáži PCB u PCBWay

Diskuse k tomuto článku

7.12.2011 08:06 tdvorak
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Odpovědět | Sbalit | Link | Blokovat | Admin
Díky za článek. Jen se mi nezobrazuje obrázek, protože ho adblock vyhodnotí jako reklamu. V cestě k obrázku je i ../reklama/..
Bedňa avatar 7.12.2011 09:59 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Jen se mi nezobrazuje obrázek, protože ho adblock vyhodnotí jako reklamu. V cestě k obrázku je i ../reklama/..
Chyba je vo vašom príjmači.
KERNEL ULTRAS video channel >>>
7.12.2011 12:08 CET
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Vlastne je to v poradku:-) On tohle totiz neni clanek, ale reklama:-) Spis se divim, ze ti adblock nezablokoval celou reklamu:-) V dalsi casti reklamy se uz dostaneme k "...a muzete to koupit ..." ;-)
7.12.2011 12:42 stn
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Kez by bylo vic takovych reklam, jako je tahle! :-)

Kazdopadne POWER7 je moc povedeny kousek hardwaru.
Bedňa avatar 7.12.2011 13:24 Bedňa | skóre: 34 | blog: Žumpa | Horňany
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Predchádzajúci reklamný článok o DeepQA.
A protože na Watsonových serverech běžel Linux, můžeme tak říci, že základem pro úspěch Watsona byl právě open source.
Myslím si že tieto reklamné články majú bližšie k Linuxu, ako tunajšie blogové zápisky.
KERNEL ULTRAS video channel >>>
tomboytom-deviant avatar 8.12.2011 04:08 tomboytom-deviant | skóre: 7 | blog: lojdovo | .com
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství

Jo, je to reklama. My jsme tady všichni typická cílovka, kde kdo tady naustále řeší koupi novýho železa ;-)

7.12.2011 17:35 Mathe | skóre: 10 | blog: mathe
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Odpovědět | Sbalit | Link | Blokovat | Admin
Dobrý článek, zajímavá technologie. Akorát jestli jsem to dobře pochopil, tak je tam chyba v jednom z letopočtů objevu Portugalska.
7.12.2011 17:42 Dochy
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Objev Portugalska bude asi teckou za Gerym co cestoval do Indie, ze? ;-)
7.12.2011 19:53 Mathe | skóre: 10 | blog: mathe
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Jasně, nevím nad čím jsem přemýšlel. Je tam přece čtřsté výročí. Stydím se...
7.12.2011 23:22 petko
Rozbalit Rozbalit vše Re: Jak se IBM Watson probojoval k vítězství
Odpovědět | Sbalit | Link | Blokovat | Admin
No a ako technologii deepqa pomaha power7? Virtualizacia ktora je v clanku spomenuta asi klucovu ulohu nezohrala. Na reklamu dobre, ale mohli nam viac prezradit teda..

ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.