Portál AbcLinuxu, 5. května 2025 13:18
Minule jsme se podívali na starší projekty, ze kterých nakonec vznikla technologie DeepQA, základní stavební kámen IBM Watson. Tentokrát se blíže podíváme na samotnou soutěž a vnitřní postupy, díky kterým Watson zvítězil v televizní soutěži nad člověkem.
YouTube je plný videí, která předvádějí Watsona v akci. Vypadá to jako technologie z budoucnosti a je pravdou, že i výzkumníkům z IBM zpočátku připadalo nemožné něco takového vyvinout. Pouze díky píli a odhodlanosti se podařilo vyvinout lepšího hráče, než je člověk. Přesto však přiznávají, že forma soutěže Watsonovi nahrávala, zejména pak důraz na rychlost a skutečnost, že odpovědí je maximálně několik slov. Kdyby šlo o písemnou vědomostní soutěž, kde by bylo smyslem rozepsat co nejkvalitnější odpověď na zadanou otázku, pak by výsledné skóre vypadalo trochu jinak.
Dalším velkým milníkem v budoucnosti bude schopnost počítače vést dialog s člověkem – myšlen je plnohodnotný dialog, nikoliv jen jednoduché reakce různých programů „na pokec“. IBM to vidí tak, že za deset let by se mohlo podařit udělat průlom tímto směrem. Neméně lákavá by pak byla schopnost systému se dále samostatně rozvíjet a hledat doposud neznámé souvislosti mezi nabytými znalostmi.
Mnoho lidí zajímalo, zda by Watson dokázal pracovat i v jiném jazyce, pokud by se mu místo World Book Encyclopedia, anglické Wikipedie a dalších anglických zdrojů (jako například knihy ze svobodného Project Gutenberg) „podstrčily“ zdroje kupříkladu v němčině. Ano i ne. Algoritmy jako takové by fungovaly, nicméně by bylo nutné doplnit logiku pro daný jazyk. Watson totiž nehledá jen určitou relevanci jako vyhledávače, ale snaží se najít pomůcky, které mu poodhalí význam vět.
Obecným základem pro analýzu významu vět je identifikace podmětu, přísudku a předmětu. Software se tak naučí základní poznatky jako „Voda je kapalina“. Neméně důležité jsou i další části vět – v soutěži Jeopardy! jde často o příslovečné určení času, program si tak může najít souvislost mezi letopočtem a informací o tom, kdo byl v danou dobu prezidentem.
Jak je vidět na následujícím obrázku, výzkumníci své algoritmy postupně zlepšovali. Výsledky porovnávali s výkonem hráčů soutěže – světle modré tečky jsou výsledky vítězů, červené jsou výsledky těch nejlepších. Při soutěži jde také o taktiku – software musí vyjádřit svou jistotu danou odpovědí a pokud je příliš nízká, vyplatí se neodpovídat než riskovat ztrátu bodů. Perličkou je, že výzkumníkům přišel při testování vhod i fanouškovský web, kde byly zveřejněny otázky a správné odpovědi v historii této televizní soutěže.
Zapeklitost otázek (a lidské řeči vůbec) si můžeme snadno předvést. Například věta „Při premiéře filmu 60 minut byl tento člověk prezidentem“ obsahuje dva oddělené problémy. Watson musí větu rozdělit na dva oddělené problémy:
Dalším krokem je odhalit povahu otázky (Kdo byl prezidentem?) a určení, v jakém období se má hledat odpověď (premiéra filmu 60 minut). Jiným zajímavým příkladem, jak musí software hledat spojitosti jsou tyto dvě věty:
Software musí najít souvislost mezi oběma letopočty, musí vědět, že Kappad se nachází v Indii, musí si být vědom příbuznosti slov „dorazil“ a „připlutí“ a pak teprve získá (i když nejistou) představu o tom, že Vasco da Gama byl objevitelem.
Zrada se ovšem může nacházet v podobě této věty:
Čistě na základě výskytu podobných slov proto nejde dělat kvalitní závěry.
V říjnu 2011 byla řada systémů POWER7, na kterých Watson běžel při soutěži, rozšířena o modely Express. Ty zpřístupňují tento hardware i menším firmám. Nejobyčejnější variantou je „710 Express“ s frekvencí 3,7 GHz při 6 jádrech nebo 3,55 GHz při 8 jádrech. Nejnadupanějším modelem je 795 s až 256 jádry o frekvenci přesahující 4 GHz.
Dostupné jsou také blade servery s o něco slabší konfigurací než mají plnohodnotní sourozenci. Prvním komerčním nasazením technologie DeepQA na serverech POWER7 by měla být americká zdravotní pojišťovna WellPoint, kde bude software hledat souvislost nikoliv mezi letopočty a mořeplavci, nýbrž mezi příznaky u pacientů a diagnózou. Tato pojišťovna má 34 milionů pojištěnců. Mezi zásadní přednosti POWER7 patří:
Ani servery POWER7, ani technologie DeepQA nejsou pro běžné firmy něčím nedosažitelným. Díky modularitě je možné hardware i software přizpůsobit na míru konkrétním potřebám. Je tedy pravděpodobné, že doba, kdy Watson bude pomáhat řešit každodenní problémy i ve vaší firmě není vůbec daleko.
Jen se mi nezobrazuje obrázek, protože ho adblock vyhodnotí jako reklamu. V cestě k obrázku je i ../reklama/..Chyba je vo vašom príjmači.
A protože na Watsonových serverech běžel Linux, můžeme tak říci, že základem pro úspěch Watsona byl právě open source.Myslím si že tieto reklamné články majú bližšie k Linuxu, ako tunajšie blogové zápisky.
Jo, je to reklama. My jsme tady všichni typická cílovka, kde kdo tady naustále řeší koupi novýho železa
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.