neděle 22. června 2014

Berte nohy na ramena, počítač prošel Turingovým testem!


Před nedávnem se do masových médií dostala hned dvě jména, která jsou nám blízká. A jak to v masových médiích bývá, výsledný obrázek je poněkud pokřivený. Prvním z nich je Noam Chomsky. V tomhle příspěvku se ale zaměřím na druhé jméno, které proběhlo zpravodajstvím, tedy na Alana Turinga a jeho test. Podobně jako s Chomským, i zde média pracovala obvyklým způsobem: Téma trefila, zbytek je trochu jinak.

„Počítačový program prošel Turingovým testem.“ Co se vlastně stalo, co to znamená, a co to znamená pro vyučování informatiky?

Předně, abyste si udělali obrázek: Původní tisková zpráva, a jeden alternativní úhel pohledu. Ve zkratce: Turingův test je nějaký test, který lze použít k posouzení inteligence (obvykle) stroje. Jistý program tímto testem prošel. Změnilo se tím něco? Ani ne.

Jak Turingův test probíhá

Porotce chatuje se dvěma entitami, jiný kontakt s nimi nemá. Ví, že jedna z nich je člověk, a druhá počítač. A snaží se tím rozhovorem zjistit, kdo je kdo. Když počítač přesvědčí aspoň 30 % porotců, mají organizátoři za to, že testem prošel. Turingův test má silné a slabé stránky a své odpůrce i kritiky. Často je ale argumentace vedena nepochopením smyslu toho, co nám test vlastně říká (což je krásně paradoxní).

Některé motivy, které se objevovaly v souvisejících zprávách, zde okomentuji. Často se objevují námitky, že počítač tak trochu podváděl, když předstíral, že je puberťák a angličtina není jeho mateřštinou. To můžeme klidně připustit, dostaneme nový titulek: Počítačový program dosáhl inteligence třináctiletého Ukrajince. Jak vidno, na principu to celkem nic nemění.

V téhle souvislosti je na místě si uvědomit zjednodušení, kterého se dopouštíme. Ač víme, že inteligence může být různě vysoká (když už se omezíme na jedinou lineární škálu), uvažujeme o ní často způsobem buď-anebo. Pan učitel „je inteligentní“, tetička „není inteligentní“. Člověk „je inteligentní“, pes taky, pavouk ne a počítač taky ne. Jenže s více příklady různých lidí a zvířat zjistíme, že hranice není ostrá. Těžko si kdy řekneme: „včera ten program ještě inteligentní (vůbec) nebyl, ale od ranního updatu už (úplně) je.“

Hranice inteligence nevidíme ostře, stejně jako hranice sluneční soustavy. Život jde dál.
Zdroj: xkcd.com, česky xkcz.cz

Trochu podivná námitka se týká omezení komunikace na chat. Proč takto znevýhodňovat lidi, kteří přece mluvit umí? Souvisí to s tím, jestli schopnost rozkódovat hlasový vstup a vytvořit hlasový výstup považujeme za projev inteligence. Zajisté jsou to úlohy obtížné a dosud nikoliv plně zvládnuté. Ale odpověď nám opět poskytne speciální (pro účel úvahy) případ: hluchoněmí. Takže ne, zpracování hlasu nemůže být podmínkou inteligence.
Stephen Hawking. Pojďme se domluvit, že realistickou syntézu řeči nebudeme počítat mezi projevy inteligence. Zdroj: Galaxy fm
Další námitka souvisí se zúčastněnými osobami — jak porotci, tak účastníky testu. Jiné složení by patrně dalo jiný výsledek. Je ale třeba si uvědomit, že to opět není chyba ani provedení testu, ani principu fungování testu, nýbrž zadání. Shodují se snad lidé na úrovni (nebo přítomnosti) inteligence u dalších lidí? My prostě moc dobře nevíme, co tím testem nepřímo testujeme. Přímo testujeme nanejvýš ve vzdělávání už pověstnou schopnost projít testem. Nelze pak čekat, že dostaneme přesvědčivé výsledky o něčem dalším.

Dále, počet porotců prý nedostačuje. Turing sám hovořil o průměrném porotci. Několikačlenná porota je nástroj, jak se takového průměru dosáhnout. Nejsem si ale jistý, jestli si autoři námitky uvědomují, k čemu rozšíření poroty obecně vede. I kdybychom vybírali porotce nejpřísnější a nejpřesnější (tedy stěží průměrné), postupně dojdou a úroveň lidskosti nutná ke složení testu začne klesat.

Možná si vzpomenete na senzační, ale vlastně zpozdilou zprávu, kdy počítač konečně porazil šachového velmistra v šachu. Zpozdilou proto, že i mnohem slabší počítač už tehdy několik let rutinně porážel průměrného člověka, dokonce i průměrného hráče šachu. To mi připadá významnější, než velmistr. Zpět k Turingově testu: Představu o fungování velké poroty nám dali účastnici festivalu Techniche 2011 v indickém Guwahátí. Cleverbot přesvědčil o své lidskosti 59,3 % (v poněkud jiném nastavení experimentu). Jestli chceme hledat tu opravdovou inteligenci, na průměrného člověka bychom spoléhat neměli — ani v porotě, ani v dotazovací kabince.

Nastavení parametrů testu je arbitrární. Počet porotců, délka trvání testu, požadované skóre (poměr obelhaných porotců) — kdyby byly parametry jiné, byl by jiný i výsledek. Je rozdíl, když řeknu např. „Maturant musí umět aspoň trojčlenku, procenta a Pythagorovu větu, čili 33 % testu,“ a když řeknu „Matematika je důležitá, maturant musí umět 33 %.“ Konkrétní parametry daného testu byly určeny tím druhým způsobem.

Mimochodem, přesvědčit 30 % porotců se možná zdá málo. Podívejme se ale pořádně, co to znamená. Těch 30 % porotců soudí nikoliv, že je daný stroj schopný nějak lidské konverzace. Říkají, že ten stroj předvádí lidštější konverzaci, než lidský účastník testu. A o lidském účastníkovi říkají, že předvádí konverzaci „strojovější“. Pro lidského účastníka to musí být skvělý pocit. Zcela jiná (a v praxi častější) situace nastává, když nevíme, kdo nebo co je na druhé straně spojení.

Nejzávažnější a nejzbytečnější připomínka

Není to žádný superpočítač, je to jen hloupý chatbot. Nedá se říct, že je inteligentní, protože je založen na databázi skutečných rozhovorů. Není to opravdová inteligence, jen předstírání. Počítač rozhovoru nerozumí.

Tyto námitky zcela míjí východiska, a tím paradoxně i smysl Turingova testu. Ono imitační nastavení vyplývá z jednoduchého pozorování. Neumíme dobře definovat, co je to inteligence. V takové situaci postrádá otázka, zda mohou stroje být inteligentní, smysl. Turing proto navrhuje otázku nahradit jinou, totiž jestli mohou stroje dobře hrát již popsanou imitační hru, tedy inteligentně se chovat.

Na rozdíl od původní otázky na ni lze odpovědět a navíc obě otázky úzce souvisí. Když se něco chová tak inteligentně, že to nerozpoznáme od člověka, není důvod neříkat, že je to inteligentní. Jestli to inteligentní opravdu je, necháme k rozhodnutí jiným.


Tenhle princip chtě nechtě užíváme každý den v souvislosti s hodnocením žáků. Celkem nás nezajímá, jestli si něco nazpaměť pamatují. Chtěli bychom vědět, jestli látce opravdu rozumí. Jenže moc nevíme, jak to poznat, dokonce i kdybychom jim směli rozřezat hlavy. Jsme omezeni na systém vstupu a výstupu, tedy sledování, jak reagují na podněty. Když se naučí reagovat správně, aniž opravdu rozuměli, jsme nahraní. Jasně, do příště přijdeme s aplikací látky v novém kontextu. Jenže nový bude jen napoprvé. Mimochodem, diskuse na toto téma s žáky bývá velmi zajímavá.

Text příspěvku se nečekaně natáhl. Proto tady skončím. Další příspěvek bude pozitivnější, totiž o tom, co by měli o Turingově testu vědět školáci.

1 komentář:

  1. O tzv. inteligentním Watsonovi jsem psal již více než před 2 lety zde - http://spomocnik.rvp.cz/clanek/11357/. Tento článek je velmi důležitý. Každý digitálně gramotný jedinec (disponující informatickým myšlením) by měl chápat podstatu umělé inteligence. Těším se na pokračování. Jen pořád dumám nad tím, kam utéci?

    OdpovědětVymazat