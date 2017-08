×

Kdy ovládnou počítače matematiku?

dnes 01:26 | Přečteno: 541× | Škola | | poslední úprava: dnes 01:26

Meta -- Mezinárodní matematická olympiáda

Když byl v šedesátých letech minulého století vyřešen problém čtyř barev, někteří čekali, že nastává éra problémů vyřešených za použití počítače. Nestalo se. Je zarážející, jak často je ještě dneska nejefektivnějším nástrojem pro řešení matematických problémů papír a tužka. Na druhé straně zaregistrovala v poslední době umělá inteligence několik úspěšných průlomů. V blogu se z pohledu matematika, avšak nikoli odborníka na strojové učení ani automatické dokazování, zamyslím nad touto otázkou.

Pro někoho je vidina pokoření tzv. IMO (International Mathematical Olympiad) stále suboptimální, pro mnoho jiných se jedná o spíše nedosažitelné sci-fi. Ostatně já to donedávna považoval rovněž za nemyslitelné, ale o deskové hře Go jsem si myslel totéž, takže už si nejsem tak jistý...

IMO je soutěž určená pro středoškolské studenty konající se každé léto různě po světě. Skoro všechny státy světa na ni vysílají svých šest nejnadějnějších studentů. Například nedávno se konala v Brazilském Rio de Janeiru, a Český IMO tým si tentokrát vedl výjimečně dobře -- skončili 14. ze 111 zemí (kdo je Čech, skáče, hop hop hop :D). Soutěží se ve dvou dnech a oba dny fungují stejně: Všichni soutěžící dostanou zadání, něco na způsob školní písemky, a cílem je během čtyř a půl hodiny vyřešit tři zadané úlohy, což většinou znamená najít důkaz nějakého tvrzení. Soutěžící mají k dispozici pouze propisku, papír a pár základních rýsovacích potřeb (kružítko, tužka, pravítko). Ačkoli jsou vybrány úlohy, o kterých se ví, že řešení mají, zřídka komu se povede vyřešit vše na plný počet bodů.

Pořadatelé se snaží dávat pozor je, aby nebylo v lidských silách zabít tyto úlohy standardními metodami jako je analytická geometrie či třeba lagrangeovy multiplikátory. Vznešeně se dá říci, že se IMO se snaží být oslavou nápaditosti a lidského důvtipu. Současně to má i pragmatické vysvětlení -- opravovatelům se nechce výpočetně složitá řešení kontrolovat.

Myšlenka porazit lidi počítačem v IMO není jen moje. Na jedné promo přednášce Josefa Urbana, který se problematikou umělé inteligence v matematice dlouhodobě zabývá, jsem se dozvěděl, že je pro IMO připravený formální jazyk, kterým by se stroji předložili úlohy. Dokonce se někteří bývalí soutěžící se nechali slyšet, že by si to s počítačem rozdali, Jen chybí ten strojový oponent...

Současné aplikace -- motor pokroku... nebo brzda?

Najít automaticky důkaz matematického tvrzení je těžké, ale ověřit formálně napsaný důkaz je pro stroj hračka. Motivací proč to dělat může být více:

Jste matematický purista a chcete mít jistotu, že je matematika opravdu postavena na těch pevných základech, které o ní lidé prohlašují. Vyřešil jste důležitý open problém, ale váš důkaz je příliš složitý na to, aby vám lidi uvěřili. Tohle byla ostatně motivace za formalizací důkazu Keplerovy domněnky o skládání koulí do prostoru. Podobné byl formalizovaný i důkaz problému čtyř barev. Jste softwarový inženýr v odvětví, kde by chyba byla fatální (letectví, lékařství) a chcete mít jistotu, že software dělá, co má.

Ať už je motivace k formálně ověřenému důkazu jakákoli, je celkem otrava psaní důkazu, ve kterém musíte být mnohem preciznější, než kdybyste to vysvětlovali normálnímu člověku. Proto je snaha, aby počítače přeci jenom měli jistou míru schopnosti si důkaz domyslet. Software, který tohle umí se nazývá "Proof Assistant" a existuje jich celá řada, já si malinko pohrál s Izabelou, ale ne dost na to, abych do ní nějak pronikl.

Izabela není úplně blbá, z návodu jsem zjistil, že sama zvládne dokázat dokonce Cantorovu větu o tom, že je potenční množina větší než množina původní. Důkazoví asistenti jsou v domýšlení si důkazů čím dál schopnější. Dalo by se čekat, že pozvolnou evolucí dosáhnou takové úrovně, že ti lidi za nimi už časem nebudou skoro vůbec potřeba s výjimkou formulace zadání...

A nebo taky ne. Proč jsem v nadpisu zmínil možnost brzdy pokroku? Když je motivace k vývoji takových nástrojů, stávají se tyto nástroje stále robustnější a schopnější dělat to, k čemu je lidi budou primárně využívat. Tím se ale odchylují od cíle opravdu matematiku pokořit. Jedná se, podobně jako třeba Mathematica, o schopné ale specializované nástroje, které jsou natolik složité na proniknutí, že odrazují výzkumníky od drobných ale možná nadějných experimentů.

Vědecký svět formální matematiky a vědecký svět strojového učení a neuronových sítí mi dneska přijde stále na míle vzdálený. Někdy se zabuduje jednoduchá technika strojového učení do automatických dokazovačů. Nebo naopak někdo vytáhne z automatických dokazovačů data, aby na konkrétní klasifikační úlohu použil moderní neuronky a zjistil, jestli to přináší nějaké výsledky. Ale že by to někdo dokázal pořádně skloubit? Už ten fakt, že důkazové systémy jsou typicky psané v jazyce ML a nástroje pro neuronové sítě jsou většinou v Pythonu je jistá bariéra.

A ostatně AlphaGo taky přišel do světa Go náhle bez předchozí spolupráce se softwarem na Go. Takže i v případě matematiky osobně tipuji, že pokud se někdy povede postavit úspěšný automat, vzejde spíše od nějakého týmu zkoumajícího AI, nežli evolucí stávajících dokazovačů.

Několik nápadů

Připadá mi provokativní, že dokážu provádět starou, místy rutinní intelektuální činnost, a přitom se dosud nikomu nepovedlo ji naučit počítač. Jak o tom tématu přemítám, občas mě napadne něco, co bych rád implementoval, kdybych na to měl čas, znalosti a prostředky.

Vzhledem k tomu, že mě nedávný blog na abclinuxu inspiroval k zapůjčení si knížky o robotech, budou možná moje nápady poněkud vědecko-fantastické, ale pokusím se držet při zemi.

Naopak, vůbec by mě nepřekvapilo, kdyby tyto nápady nebyly nové a někdo se o něco z toho už pokoušel. Tak trochu čekám, že se pod blogem najdou chytří lidi, kteří budou mít v různých oblastech lepší přehled než já.

Matematika jako videohra

Současná umělá inteligence se pyšní tím, že umí hrát videohry. Začalo to tuším jako projekt DeepMindu, teď existuje samotná stránka s připravenými videohrami pro umělou inteligenci. Princip je prostý -- neuronová síť dostane na vstupu pixely z obrazovky a zkusí reakci. Podle toho, jak ve spoustě různých pokusů dostává body, se učí ve hře zorientovat a pochopit, jak se to ovládá a co je cílem.

Matematika je taky tak trochu videohra. Máte k dispozici různé věty a formule a snažíte se je šikovně kombinovat, abyste dostávali "zajímavé" věty. Co znamená "zajímavé" není explicitně jasné, ale pro začátek by to mohly být věty dokázané lidmi, než by se počítač naučil "zajímavost" nějak poznat sám.

Zjevný rozdíl matematiky oproti videohře spočívá ve vstupu, ale přijde mi to jako docela technický detail. Ve videohře dostáváme pixely, které chceme zpracovat metodami na zpracování obrazu (konvoluční sítě), zatímco v matematice dostáváme stromové formule, které se dají prohnat metodami zpracování jazyka, třeba pomocí stromové rekurzivní sítě.

Přirozenou námitkou by mohlo být, že v logických hrách jako je Sokoban je tato obecná umělá inteligence dost marná. To je ale dáno tím, že tyto hry samy o sobě nenabízí moc prostoru k "přemýšlení".

Naopak, "matematická hra" by byla prostorem k přemýšlení "by design". Představuji si to jako když právě dáte matematikovi k dispozici tu tužku a papír, aby si nemusel chudák všechno představovat.

Problém samozřejmě je navrhnout vhodné rozhraní mezi neuronkou a matematikou, to může mít zásadní vliv na úspěšnost oné neuronky. Autor by musel rozumět jak neuronkám, tak formální matematice, a mimo jiné překonat v předchozí kapitole zmíněnou překážku, že neuronky "se" píšou v Pythonu, zatímco dokazovací prostředí "se" píšou v Ocaml. Ostatně to bych tipoval jako důvod, proč se to ještě nezkusilo (jestli se pletu, opravte mě, o algoritmech vím, a taky to částečně považuji za cestu správným směrem, ale daleko od dokazování).

Pěkné a jednoduché důkazy

V současnosti se rozlišují "důkazy pro počítač" a "důkazy pro člověka". Vyrobení důkazu pro počítač z důkazu pro člověka je doménou interaktivních dokazovačů, ale ani cesta zpátky není nikterak snadná. Počítačový důkaz většinou spočívá v obrovském množství kroků, z nichž je patrně mnoho zbytečných a na konci je kýžený spor.

Vydolovat z této změti něco lidsky čitelného je nesnadné ale považuje se to za dost odlišný problém než samotné nalezení důkazu. Já jsem ale přesvědčen, že pokud chceme automat, který úspěšně dokazuje, potřebujeme automat, který umí hledat "pěkné" důkazy. Nemyslím, že je to jen lidská touha mít výsledek kontrolou.

K čemu totiž matematikům slouží důkaz?

K tomu, aby věděli, že tvrzení platí. K tomu, aby věděli, proč tvrzení platí. K tomu, aby se jím mohli inspirovat v hledání dalších důkazů.

Co se týče bodu 1, je jedno, jestli je důkaz jednoduchý či složitý, hlavně, že je. Bod 2 je spíše filosofický problém, který může být stroji docela ukradený. Bod 3 však považuji za klíčový.

Třeba hlavní výsledek mojí diplomky spočíval v tom, že jsem zobecnil dříve známý důkaz, což se mi povedlo díky tomu, že ještě někdo jiný tenhle důkaz napsal jednodušeji. Vlastně je valná část matematického výzkumu o zjednodušování a zobecňování. Kdyby počítače samy od sebe usilovaly o jednoduchost, třeba by nebylo tolik zbastleného kódu ...

Jednoduchost a schopnost vypíchnutí myšlenky z důkazu jsou zajisté pěkné ideály, ale neříkají moc o tom, jak to implementovat. Nabídnu tedy o něco konkrétnější vizi. Dejme tomu, že už máme algoritmus s prvky umělé inteligence, který je schopný najít důkaz. Tím, že se rozhoduje částečně náhodně, najde někdy důkaz kratší, někdy delší, někdy žádný.

Mohli bychom mu pomoci, kdybychom ho nechali si na začátku celý nejkratší důkaz "přečíst" a až potom by se snažil onen důkaz opět provést (opět co nejkratší, co nejspolehlivěji). Vize je, že se časem naučí si z důkazu vytáhnout ty "důležité myšlenky" a vyrobit si pro svoje budoucí poslání efektivní "nápovědu". Je to vlastně jen jakási varianta auto-enkodéru, které se používají pro kompresi, zbavení šumu, generování obrázků atp.., Jen s tím rozdílem že namísto co nejvěrnějšího napodobení hodnotíme jiná kritéria.

Dalo by se to iterovat. Zjednodušený důkaz by mohl vést k lepšímu načtení, a to pak k ještě lepšímu zjednodušení. Pak by tenhle princip mohl mít ještě další uplatnění, co třeba když se chci inspirovat důkazem tvrzení A pro důkaz tvrzení B? Vezmu si nápovědu vyrobenou z důkazu A a aplikuji ji na důkaz B. Když chci zobecnit důkazy několika speciálních případů, zkusím nakombinovat nápovědy příslušných důkazů, ... Variant je mnoho.

Inspirace v lidské výuce

Jakkoli mám k výuce matematiky z jedné strany jisté výhrady, a z druhé se mi zdá, že ani spoustě lidí to téma neumíme pořádně vysvětlit, řekl bych, že principiálně je výuka matematiky rozvržená docela rozumně. Přinejmenším je správně, že se v první třídě učí děti počítat místo toho, aby se naučily axiomy teorie množin nebo základy teorie kategorií.

Prvňák totiž nepochopí kategoriální součin nebo axiom extensionality. Z teorie typů, která se často v dokazovačích používá příklad neuvádím, jelikož ji moc neumím, ale čekám, že to není učivo vhodné pro první třídu. Je tedy z jistého pohledu pochybné chtít po umělé inteligenci, aby se zorientovala rovnou ve vysokoškolských článcích postavených na formální teorii, když za sebou nemá "základní" a "střední" školu.

Srovnejme to opět s Go. AlphaGo se naučilo hrát tak, že se napřed intuitivně (ne moc úspěšně) snažilo odkoukat, jak hrají lidi okolo něj, a pak prostě hrálo a tak trénovalo. To je docela smysluplný přístup, jak naučit Go člověka, nemyslíte? Nejsem si ale moc jistý, že rozumný způsob, jak naučit člověka matematiku, je mu říci, ať zkusí přečíst formalizované články a pak dělá něco podobného.

Jeden z návrhů, jak by mohl počítač postupně učit by mohl vypadat třeba takto. Jazyk, na kterém to celé stojí může být klidně ten HOL založený na teorii typů, ale celá práce s ním by byla z počátku záměrně omezená.

1. Kolo: jenom tipuje, zda tvrzení platí, nebo ne:

(i) Čistá výroková logika bez proměnných -- "True nebo True" je "True",

nauč se to. (ii) Stále jen výroková logika s jednou kvantifikovanou proměnnou.

(iii) Logika plus aritmetika na přirozených číslech bez proměnných (+ * < <= > >= - / %).

(iv) Čistě výroková logika více kvantifikátory.

(v) Bez kvantifikace, Logika plus aritmetika s operátorem sumy.

2. Kolo: Opět (i)-(v), ale tentokrát se snaž tvrzení vyvrátit nebo dokázat (dost možná s omezeným dokazovacím systémem).

(vi) Hledáme neznámou typu přirozené číslo nebo důkaz, že neexistuje.

(vii) Více neznámých typu přirozené číslo.

(viii) Zkoumáme funkce N -> N.

A tak podobně.

Geometrie

Na střední škole se vyučuje (euklidovská) geometrie coby "teorie o přímkách a kružnicích". Myslím, že to má dva pedagogické důvody, z nichž jeden je smysluplný i u umělé inteligence:

Geometrie se dobře kreslí a představuje, přičemž zrak mají lidi dobře vyvinutý (to není on ) Dokazování v geometrii není triviální, ale je jednoduché.

Co tím myslím: V geometrii je spousta tvrzení, která nejsou zřejmá, ale mají poměrně pěkné důkazy. Jednou výhodou geometrie oproti jiným oborům je, že numerické testování pravdivosti tvrzení je dost spolehlivé. Hm... Těžiště, průsečík výšek a střed kružnice opsané leží na přímce. Zkusím s tím pohýbat v Geogebře. Pořád to platí. Tak to bude asi pravda.

Další výhodou geometrie je velmi častý výskyt ekvivalence. Vzdálenosti XA, XB jsou stejné právě tehdy, když X leží na ose úsečky AB. Tyto vlastnosti dělají z euklidovské geometrie přístupný obor pro středoškolské studenty, a řekl bych, že i pro umělou inteligenci (jen je pak fuška vysvětlit implikaci ).

Doslechl jsem se o projektu Discoverer, který nachází geometrická tvrzení. Nejsem si jistý, ale domnívám se, že tato tvrzení ověřuje numericky (nebo v lepším případě pomocí analytické geometrie) a vlastně jenom zkouší dělat různé konstrukce, takže od mnou navrhovaného programu, který by se snažil učit hledat pěkné geometrické důkazy má ještě docela daleko.

