Velkolepé úspěchy AI pěkně od začátku

V tomto článku se vracíme k zajímavé knize profesora Markse o umělé inteligenci s titulem The Non-Computable You (Vaše nevyčíslitelné Já). Nastíníme si stručně vývoj umělé inteligence od 60. let až po současnost a uvidíme některé matematické a fyzikální koncepty, které určují hranice její využitelnosti.

ADALINE a preceptron

Robert J. Marks ve třetí části své knihy podává přehled vývoje umělé inteligence. Začíná od „vykopávek“ z konce 50. let, kdy postavil dr. Bernard Widrow první umělou neuronovou síť. K propojování neuronů v ADALINE se používal elektrolyt. O počátečních úspěších dr. Widrowa si můžete shlédnout autentické dvacetiminutové video Science in Action níže. Mladý Widrow prezentuje úspěchy neuronové sítě, která v předpovědi počasí překonala zkušeného meterologa a uměla zapisovat mluvenou řeč. Widrow se však brání říkat, že počítač „myslí“, protože „vlastně pořádně nevíme, co myšlení je.“ Vrcholnou aplikací ADALINE bylo použití v nadzvukových letadlech Concorde.

Bernard Widrow popisuje, jak funguje ADALINE.

Přibližně ve stejné době vyvinul Frank Rosenblatt expertní systém preceptron, což byla symbolická AI používající k rozhodování soustavu pravidel. Rozdíl mezi těmito dvěma typy umělé inteligence je v tom, že neuronová síť se učí na vzorech, zatímco expertní systém obsahuje sadu pravidel formulovaných odborníky, takže využívá expertizu skutečných lidí. Škoda, že místo toho, aby se dva přístupy k AI doplňovaly, staly se nelítostnými konkurenty. Jejich vzájemné útoky a osočování nakonec vyústily v opadnutí zájmu investorů a grantových agentur o AI.

Vzkříšení zájmu o AI

Profesor Marks se jako student přidal k výzkumu umělé inteligence v druhé vlně, když na počátku 80. let vzkřísil zájem o umělou inteligenci John Hopfield. Sice vyřešil nedostatky původních systémů tím, že použil adaptivní procesy, ale některé otázky zůstaly nedotčeny. Například růst Hopfieldovy neuronové sítě: s počtem neuronů roste počet vazeb mezi nimi kvadraticky, což v praxi brání užití velkých neuronových sítí. Nakonec se analogové Hopfieldovy neuronové sítě nedočkaly žádného praktického využití.

Edukační video zjednodušeně vysvětluje vícevrstvou neuronovou síť.

Zájem o AI ale znovu ožil, když byl představen vícevrstvý perceptron, který zobecňuje původní koncepty tím, že se doplnily skryté vrstvy neuronů. Využívá techniku učení s učitelem, která se nazývá zpětné šíření. Zpětné šíření je učební algoritmus, který získané výstupy porovná s očekávanými, aby určil chybu. Potom se postupuje zpět od poslední vrstvy k první a zjistí se, do jaké míry k chybě přispěly jednotlivé neurony. Přenastaví se jim váhy tak, aby se snížila hodnota chyby. To umožňuje systému při každé další iteraci „učit se“ ze svých chyb. Aplikovatelnost umělé inteligence se tím se značně rozšířila.

Následné spojení AI s fuzzy logikou přineslo řadu praktických aplikací. Fuzzy logika pracuje se s vícehodnotovou logikou – místo dvou hodnot 0 a 1 (nepravda/pravda) používá interval <0, 1>. Jak to funguje, vysvětluje profesor Marks na řízení činnosti automatické pračky. Expertní systémy s fuzzy logikou se používají v aplikacích jako klimatizace, pračky, vysavače, hrnce na rýži, mikrovlnky, sušičky, fény a ledničky. K jejich špičkovému využití patří výškoměry v raketoplánech, tempomaty v autech, bioinženýrství a předpověď spotřeby elektřiny.

Současný boom AI

V současnosti se může umělá inteligence pochlubit pestrou paletou špičkových úspěchů, o nichž už byla řeč v první části recenze:

  • šachový program Deep Blue,
  • program DeepMind Alpha-Go,
  • deepfake videa,
  • umělé obrázky generované pomocí GAN,
  • próza psaná programem GTP,
  • vítězství Watsona od IBM v kvízovém pořadu Jeopardy.

Zpočátku byly všechny tyto úspěchy fenomenální, ale postupem času se staly samozřejmostí. Většina těchto typů umělé inteligence je pouze realizací starších nápadů, pro které dnes dozrála technologie. Např. algoritmus Minimax, kterým porazil v šachuvelmistra Kasparova v roce 1997 Deep Blue, vymyslel Claude Shannon už roku 1948. Tady Marks vzpomíná na dobu svého mládí, aby přiblížil mladším čtenářům, jak moc se doba změnila. Však si vezměme příklady, které autor uvádí:

  • řízení aut pomocí AI: Uberu taxikáři v New Yorku a Londýně jen těžko konkurují,
  • on-line obchod a filmy – Amazon a Netflix jsou dnes samozřejmostí,
  • vyhledávání informací na Googlu místo knihoven,
  • videohovory pomocí Zoomu v smart-hodinkách na zápěstí.

Hluboké učení technické

U tradičních vícevrstvých neuronových sítí se k učení používalo jen několik vlastností vzoru. Hluboké učení umožňuje pracovat s tisíci vstupů. Takže k rozlišení basketbalistů od zápasníků sumo by se dříve použila výška a váha, nyní je možné použít obrázky borců, kde každý pixel je vstupem. Klíčové je vyhodnotit, která informace je důležitá a která se nehodí. V příkpadu rozlišování sportovců AI odstraní pozadí obrázků, ale to nestačí. Umělá inteligence nepracuje s celým obrázkem naráz, ale vždy jen s malým okénkem z něho. Tím se sníží potřebný počet učebních vzorů na přijatelnou mez.

Hlubokého učení se používá na rozpoznávání obrazů, rozpoznávání řeči, k analýze lékařských snímků i například detekci finančních podvodů. Má však stále svoje slabé stránky. Jednou z nich je citlivost. Paul Scharre je odborník na vojenské využití AI. Varuje, že v bojových podmínkách je možné hluboké neuronové sítě oklamat využitím známých slabých stránek rozpoznávání obrazů. Podvratné působení protivníka může síť navést na nesprávný cíl, což by v případě, že systém není pod dozorem člověka, mohlo vést k tragickým důsledkům. Tím je vojenské využití současné úrovně rozpoznávání obrázkou omezeno. Další slabinou současné umělé inteligence je to, že její metody nejsou dostatečně teoreticky popsány.

Černá skříňka

Z principu však zůstává neuronové síti jedna nevýhoda – je to v podstatě černá skříňka. Umí vytvořit systém, který přiřadí vstupům požadované výstupy, aniž by byla známa vnitřní struktura modelu. Že to může být problém ukázala zkušenost chicagské policie, když nasadila AI v prevenci proti zločinu. V roce 1996 se měl konat sněm Demokratické strany, který nakonec nominoval Billa Clintona na prezidenta. Úřadům byla varováním historická zkušenost z roku 1968, kdy radikální mládež vyvolala při příležitosti Demokratického sněmu v Chicagu nepokoje. Neuronová síť s využitím dat z roku 1968 identifikovala policisty, kteří představují bezpečnostní riziko. Znepokojené policejní odbory se obrátily na soud, aby rozhodl, zda nedošlo k diskriminaci. Ten se inženýrů zeptal, na základě kterých kriterií policisty vybrali. Jelikož nelze vyjmenovat žádná jednoznačná kriteria, jak AI dospěla ke svým výsledkům, soud rozhodl ve prospěch znevýhodněných policistů.

Tento příklad ukazuje, že využití AI vždy bude mít své hranice. Proto se fungování neuronových sítí musí vždy otestovat, než se začnou masově používat. Teoretickému vymezení hranic možností AI je věnovaná další část knihy, na kterou si člověk musí „vzít rozum do hrsti“.

Meze vyčíslitelnosti: teoretické základy AI

V poměrně náročné čtvrté části knihy autor blíže seznamuje s matematickými koncepty vyčíslitelnosti a náhodnosti. Zkoumá hlouběji hranice umělé inteligence, a vysvětluje je pro laiky srozumitelným způsobem.

Turingův stroj a problém zastavení

Alan Turing, který je považován za zakladatele teoretické informatiky, přirovnával lidský mozek k počítači. Snil o tom, že bude sestrojen počítač, který napodobí člověka. V roce 1936 popsal Turingův stroj, což je matematický model, který pracuje se symbolickým jazykem na základě daných pravidel. Čtecí hlava prochází a postupně vykonává příkazy na nekonečné pásce. Turingův stroj lze použít k simulaci kteréhokoliv počítačového programu. Stal se měřítkem toho, co je a co není možné na počítači zpracovat – mezí vyčíslitelnosti.

Turing také dokázal, že existují nealgoritmické (algoritmicky nerozhodnutelné) úlohy. Příkladem je problém zastavení: Chceme vědět, zda daný program po konečném počtu kroků skončí, nebo se počítač zacyklí. Dalo by se sestrojit počítač – říkejme mu Orákulum – který by posoudil, zda se daný program pro daný vstup zastaví? Turing dokázal, že to není možné.

Anglické video předkládá důkaz sporem, že nemůže existovat počítač, který by řešil problém zastavení. Zdroj: Code.org

Znát tak nepoznatelné!

Autor pokračuje zajímavou odbočkou do matematiky. Vysvětluje, že Turingův výsledek je založen na Gödelových větách o neúplnosti, které Marks ilustruje fiktivním průzkumem mezi kolegy. Neformální anketa chce zjistit u všech zaměstnanců firmy, jakým zlozvykům se oddávají. Zeptáme se i Kurta Gödela, a on odpoví: „Fičím na tom, co ještě nemáš na seznamu.“ A co teď? Když si to zapíšeme, nebude to už opdovídat Gödelově definici. Ale v opačném případě nebude náš seznam nikdy úplný.

Profesor Marks podává přehled matematických problémů, které by Turingovo Orákulumdokázalo vyřešit: např. Goldbachova hypotéza, Legendrova domněnka a Riemannova hypotéza (považovaná za nejdůležitější nedořešenou matematickou otázku). Navíc dodává, že by nám místo takového zázračného stroje stačilo znát hodnotu jediného čísla, které nazýváme Chaitinovo číslo.

Každému programu zapsanému v určitém programovacím jazyku odpovídá Chaitinovo číslo mezi 0 a 1. Toto číslo má nevídané vlastnosti a lze ho použít k potvrzení nebo vyvrácení každého známého matematického problému, kde stačí jediný protipříklad. Zádrhel je však v tom, že přestože víme, že Chaitinovo číslo existuje,je nepoznatelné. Myšlenka, že něco prokazatelně existuje, a přesto je to nepoznatelné, má své filozofické důsledky: připomíná to Platónovu Alegorii jeskyně.

Jsou náhodná čísla náhodná?

Každý, kdo uvažuje o aritmetických metodách vytváření náhodných číslic, je samozřejmě v stavu hříchu.

John von Neumann

Počítače se nedokáží chovat nahodile. Jsou deterministické, a proto nedokáží generovat náhodná čísla. Náhodná čísla generovaná softwarově jsou totiž pseudonáhodná. To znamená, že vznikají z počátečního stavu (random seed) postupným přičítáním nějaké nepravidelné posloupnosti čísel. Např. náhodné číslo z intervalu (0, 1) získáme ze zvoleného čísla mezi 0 a 1 přičtením π, když odstraníme celou část vlevo od desetinné čárky. V důsledku toho dostaneme ze stejného počátečního stavu vždy stejnou posloupnost. Za určitých okolností tedy lze předvídat následující hodnotu, což může být problém, pokud čísla například požíváme k šifrování. V roce 2007 generátor náhodných čísel Microsoftu propadl v testu náhodnosti. Skutečnou náhodnost musíme hledat ve fyzikálních jevech vně počítače, např. v kvantové mechanice.

hrací kostky
Foto Pixabay

Kdo není šokován, když se poprvé setká s kvantovou teorií, jí dozajista neporozuměl.

Niels Bohr

Tady profesor Marks tady prozměnu zabrousí do fyziky. Vysvětluje, že díky Newtonovské fyzice je vlastně všechno včetně hodu mincí deterministické. Kdybychom házeli molitanovou půlmetrovou minci na koberec, dalo by se se 100% úspešností házet zvolenou hodnotu. Avšak za normálních okolností je ve hře tolik faktorů, že nám celý proces připadá náhodný a dá dobře popsat teorií pravděpodobnosti.

Kvantové kostky

Bůh nehraje s vesmírem v kostky.

Albert Einstein

V kvantové mechanice se jeví vlnová funkce částice tak, jakoby nabývala mnoha hodnot naráz. To platí, dokud její hodnotu nezměříme. Pak dojde ke kolapsu vlnové funkce do jediné hodnoty. Je jako komiksová postava, která je neviditelná, dokud se na ní někdo nepodívá. Einstein si myslel, že musejí existovat nějaké skryté proměnné, kvůli nimž se nám hodnota vlnové funkce jeví náhodně. Nicméně později J. S. Bell dokázal, že žádné skryté proměnné neexistují, a tudíž do našeho vesmíru neustále přibývají náhodné prvky prostřednictvím kolapsu vlnové funkce. Sir Roger Penrose se domnívá, že nealgoritmické (nevyčíslitelné) charakteristiky lidského mozku vyplývají právě z kvantové mechaniky v mozkových mikrotubulích. Tady Marks však upozorňuje, že tot vysvětlení kreativity lidského myšlení pokulhává, protože nevysvětluje komplexnost nápadů. Jak už bylo řečeno v první části článku, skutečně průlomové myšlenky často přijdou jako blesk z čistého nebe a mají komplexní strukturu.

mozek
Zdroj: Unsplash/Milad Fakurian

Pokračování příště

Tím končí odbočka pro matfyzáky a šprty i přehled vývoje umělé inteligence. Nicméně Marksova kniha ještě zdaleka nekončí, má další dvě části. Pátá část knihy se zabývá etikou AI a šestá si klade otázku, kam vývoj AI bude směřovat. To jsou témata, která si vyžadují samostatný článek. Pokud máte zájem o AI, raději si sami přečtěte Marksovu knihu.

Robert J. Marks: The Non-Computable You – What you can do that Artificial Intelligence never will, Seattle Discovery Institute Press 2022, 393 stran

obálka knihy

Přečteno 189-krát