Esej: V patu
Software se naučil za odpoledne hrát šachy lépe než lidé za 1500 let. Výsledkem je nečekaná nuda
redaktor
Jonathan Schaeffer nevěděl, co počít. Profesor kybernetiky na kanadské University of Alberta strávil většinu své kariéry vývojem šachového softwaru, přičemž jeden z jeho programů byl v osmdesátých letech chvíli považován za nejvýkonnější na světě. Byl součástí týmu z IBM, jenž vyvinul Deep Blue, počítač, který v roce 1997 slavně porazil nejlepšího hráče (nejen) své doby Garryho Kasparova. Navíc je sám šachovým mistrem. Zkrátka, když hraje počítač šachy, málokdo na světě je v té situaci více doma než právě Schaeffer.
A přesto – tento kyberšachový mág seděl nad elektronickou šachovnicí univerzitní budovy na londýnském King’s Cross a nevěřil svým očím. Před sebou měl rozehranou jednu ze stovky partií, v nichž měřil síly Stockfish 8, špičkový šachový software své doby, s programem AlphaZero od Googlu. Google hrál bílými a nevedl si nijak dobře; černý Stockfish měl dobrou obrannou pozici, a dokonce výraznou materiální převahu, klíčový parametr šachové partie.
Nesmyslná oběť
Ano, čekáme na chvíli, kdy někdo řekne, že bílý by v šachu neměl mít automatickou výhodu jen díky barvě povrchu. Až to přijde (a dlouho to trvat nebude, věřte), bude to něco, co svět do té doby neviděl. Tentokrát se však stalo něco jiného, co svět ještě neviděl, a navíc to bylo důležité.
V jedenadvacátém tahu provedl bílý AlphaZero to, co udělá vaše desetiletá dcera, když ji přestane partie bavit. Vzal střelce, jednu ze svých mála zbývajících figur, a nesmyslně se s ním vydal doprostřed černé hradby, přímo do rány jednoho z pěchů. Černý pochopitelně neváhal a donkichotského střelce promptně zlikvidoval.
Jeho materiální převaha měla v tu chvíli z partie udělat jasnou záležitost. Jenže – kdo kdy hrál šachy, zná ten typ situace velmi dobře – najednou to nějak přestalo klapat. Černý se dostal do situace, kdy sám sobě překážel, všude byl o tah později, na nic kloudného se nezmohl a byl nakonec rád, že partii dostrkal k remíze.
Schaeffer a spol. kroutili hlavou. Onen zdánlivě nesmyslný jedenadvacátý tah nebyl prostým obětováním figury za poziční výhodu. To je jinak běžný taktický prostředek, ale uvedená situace k ničemu takovému nevybízela. Výhoda, kterou bílý získal, nebyla patrná ani skvělým šachistům, kteří partii přihlíželi, ani Stockfishovi osmičce, softwaru bezvadně nakrmenému veškerou šachovou historií. AlphaZero vymyslel tah, jaký ještě žádná šachovnice nikdy nezažila.
Byzantilion za milisekundu
Jak je to možné? Odpověď je logická, ale trochu z ní mrazí: AlphaZero vymyslel geniální řešení šachové situace právě proto, že není šachovým softwarem. Ovládl tu královskou hru nikoli tak, jako to dělá s různou měrou úspěchu každý z nás, tedy kopírováním tahů, které provádí v neděli odpoledne otec s návštěvami.
Ovládl ji tak, že mu někdo od Larryho Page nadiktoval pravidla a řekl: A teď zkoušej. AlphaZero potřeboval zkoušet čtyři hodiny, než byl schopen porazit nejlepší specializovaný šachový software – Stockfishe. Během oněch čtyř hodin přišel na věci, jichž žádná lidská mysl dosud nedosáhla. Žádný šachista-člověk by v té situaci střelce neobětoval; poziční výhoda, která z oběti plynula, byla příliš vzdálená a nejasná. Tím spíš to nemohl předvídat chudák Stockfish.
Coby soupeř neměl Stockfish proti AlphaZero šanci, přestože Stockfish dokázal tou dobou spočítat asi šedesát milionů tahů za sekundu. Taková hrubá síla byla donedávna tím, co používaly počítače k porážení i nejlepších lidských šachistů. Je nejspíš možné, že takovou sílu lze dále násobit, aby nějaký budoucí Stockfish 30 dokázal spočítat byzantilion tahů za milisekundu – ale nejspíš by ani to nebylo dost. Důvodem je, že Stockfish počítá strašně rychle všechny možnosti, jimiž ho jeho vládci (Jak se říká takovému člověku? Pěstitel? Krotitel? Programátor?) nakrmili. Dokáže se nepředstavitelně bravurně pohybovat v rámci daném veškerou lidskou zkušeností v oboru šachu.
AlphaZero na lidskou zkušenost v oboru šachu kašle – a může si to dovolit, přestože umí spočítat pouze osmdesát tisíc tahů za vteřinu. Dokáže totiž na rozdíl od Stockfishe „poznat“, kdy našel správný tah, a s počítáním dalších se nezahazovat. To je klíčová věc nejen pro šachovou partii, nýbrž pro veškeré technologie souhrnně zvané umělá inteligence.
Technologicky je to velký průlom. Naučit počítač, aby dělal jen věci užitečné a neplýtval energií na hlouposti, je tradičně největším problémem. Pro Stockfishe je úplně pitomý tah pěchem na druhé straně šachovnice hoden uvažování stejně jako smrtící úder šach-garde. Poctivě je všechny přežvýká – a to stojí čas a energii. AlphaZero, stroj používající nikoli šachová schémata, nýbrž neurální síť imitující způsob fungování lidského mozku, eliminuje pitomosti od začátku.
Samozřejmě to je možné především proto, že šach lze kompletně sledovat podle neměnných pravidel a má velmi omezený horizont. Kdybyste řekli počítači, aby vám našel v kuchyni kafe, pořád k tomu bude potřebovat víc „tahů“ než člověk. Ale zatímco Stockfish bude strkat prsty do zásuvky, obracet cukřenku a podobně, AlphaZero se bude dívat do šuplíků. To je obrovská úspora času i energie.
Penaltový rozstřel
Co na to lidé, je druhá věc. Garry Kasparov nenesl porážku od Deep Blue lehce. Dodnes, když se ho na zápas hraný téměř před čtvrtstoletím zeptáte, nejste si jisti, jestli po vás nehodí popelník. Ale zároveň se stal v oboru šachového softwaru znalcem a v AlphaZero viděl velkou budoucnost své hry. Když sledoval výše popisovanou partii, viděli na něm jeho kolegové zjevnou radost. „AlphaZero k mé velké radosti obětoval!“ popisoval později své pocity nad rozhodujícím jedenadvacátým tahem. „Tohle je první krok k vytvoření skutečné umělé inteligence.“
Vojtěch Velický
Ruský exmistr světa měl na mysli především to, že AlphaZero hrál typově podobně jako on sám – nevyzpytatelný útok v kterémkoli momentu partie býval Kasparovovým mistrovským kouskem. Ale nejen to. Šachu hrozila nepěkná budoucnost pomalé „smrti remízou“, tedy naprostá převaha obrany nad útokem, která dokáže poměrně spolehlivě černému ubránit remízu za každou cenu. Kasparov – a s ním mnozí další – měl za to, že přístup AlphaZero dokáže tuto smutnou budoucnost odvrátit.
Jenže to dopadlo jinak. Výše popisované události se odehrály již před čtyřmi lety, na sklonku roku 2017. O rok později obhajoval norský šachový génius Magnus Carlsen titul mistra světa proti vyzývateli Fabianu Caruanovi. Vyhrál – ale všech dvanáct partií skončilo remízou, o titulu rozhodly bleskové partie, které fungují jako penaltový rozstřel ve fotbalu nebo tie-break v tenisu.
Jen žádnou chybu!
Jedním z důvodů je fakt, že Google drží AlphaZero pod pokličkou, kdežto Stockfish a další specializované šachové programy vrcholového kalibru jsou k mání běžně na trhu. Software napěchovaný lidskou zkušeností umí ze všeho nejlépe eliminovat chyby a podle toho koná. Dnešní špičková partie tak není soubojem dvou myslí, jak praví původní smysl hry.
Dokonce není ani soubojem týmů poradců, jak se stalo praxí od osmdesátých let. Jde o to, kdo dokáže využít svůj software lépe. A také legálně, ne jako Igor Rausis, původem ukrajinský velmistr (postupně hrající za Litvu, Bangladéš a Českou republiku). Ten si předloni uřízl ostudu, když se nechal během turnajové partie přistihnout, jak na záchodě hledá na telefonu správný tah. Nejde o to, že by Rausis byl špatný šachista, nýbrž o to, že i na dobře obsazeném turnaji může uspět každý blb s telefonem, jen když na něm bude umět hledat dostatečně nenápadně.
To vše samozřejmě ubírá šachu na atraktivitě. K čemu bude sledovat závody F1, když víte, že někdo jiný umí jezdit podstatně rychleji a šikovněji? Či dokonce dokonale rychle a šikovně, jak to jen podle fyzikálních zákonů jde? „Jak jednou budete umět hrát bezchybně, nebudete hrát vůbec,“ napsal před bratru sto lety v památné eseji Dokonalá hra Gilbert Keith Chesterton. „V momentě, kdy se hra stane dokonalou, zcela zmizí.“
Není to poprvé, kdy se lidé věci znalí obávají, že šach zajde na úbytě. José Raúl Capablanca téměř před stoletím tvrdil, že hra je ve své podstatě vyčerpána a k jejímu oživení je třeba změny pravidel. Navrhoval tehdy rozšířit šachovnici o dvě řady v obou rozměrech a vytvoření nových figur.
Nápad nezabral, myšlenka na záchranu šachu pomocí změny pravidel však přetrvala. V sedmdesátých letech americký enfant terrible Bobby Fischer navrhoval, aby pořadí figur při rozestavení bylo dáno náhodně, losem. To by podle něho zamezilo přílišnému zmechanizování způsobů otevření hry. „Steinitz, Capablanca nebo Aljechin byli skvělí hráči, ale dnes by je porážel kdekdo,“ říkal před padesáti lety Fischer. „Je to jen proto, že dnešní hráči mají nazpaměť naučené způsoby otevření, o kterých dříve neměl nikdo ani ponětí.“
Tvořivost je za námi
Dnes zní obava ze smrti šachu naléhavěji než kdykoli předtím. Nejde tolik o to, že by počítače prostě převzaly roli lidí. Souboj dvou živých lidí je pořád svým způsobem přitažlivý – pro svoji dramatičnost, i když už méně díky bádání neprobádaného. Problém je v tom, že software omezuje hráčskou chuť podstupovat riziko. Máte-li k dispozici software, který je právě na omezování rizika přímo zaměřen, není divu. Když má špičkový hráč možnost vyvarovat se chyb, těžko po něm chtít, aby ji nevyužil. Ale suma výsledků takových správných individuálních rozhodnutí šťastná není. „Myslím, že éra dynamického tvořivého šachu je za námi,“ citoval list Financial Times uzbeckého velmistra Rustama Kasimdžanova.
Dnes, kdy vyšlo toto číslo týdeníku Hrot, hraje Magnus Carlsen znovu o titul mistra světa. Proti němu stojí Rus Jan Něpomňaščij, jenž má pověst hráče ochotného podstupovat riziko. (Když v deváté partii udělal chybu, prohrál třetí ze čtyř partií po sobě a před víkendem vypadal na ručník.)
Carlsen je neuvěřitelný hráč, jehož renomé dnes je srovnatelné s Kasparovovým v posledních dvaceti letech 20. století. Ale trable jeho i jeho soupeřů ukazují na širší problém. Posledních zhruba sto let bylo možné první obavu z umělé inteligence formulovat po vzoru Čapkova R.U.R. jako strach z toho, že se k nám budoucí roboti nebudou chovat dost slušně. Než na to však dojde, vyvstává obava nová: jak se u vidiny dokonalosti na dosah budeme chovat my sami jeden k druhému. Jsou-li šachy dobrým příkladem, nevypadá to vůbec pěkně.