Přichází Orwellův veršotep? Umělá inteligence je stále kreativnější, na vysokou kulturu ale zatím nemá
Nahradí lidskou uměleckou tvorbu umělá inteligence? Nebojte, Orwellův veršotep zatím na scénu nepřišel. AI je ale stále kreativnější a kromě obrázků už umí generovat i video nebo skladby v češtině. Poslechněte si neoficiální hymnu Hrotu24, kterou okomentovali experti na umělou inteligenci.
redaktor
Bylo to jenom marný vokouzlení, vodešlo jako aprílovej den; jenže ty voči, ta jeho slova, ukradly mýho srdce sen. Už před tři čtvrtě stoletím předpověděl britský spisovatel George Orwell, že stroje budou jednou umět skládat písně – a to bez jakéhokoli lidského zásahu. A dnešní umělá inteligence má s takzvaným veršotepem z románu 1984 skutečně něco společného. Například to, že zatím produkuje jen podřadné braky. To se ale může brzy změnit.
Pro lepší představu toho, co všechno už AI umí, si server Hrot24 nechal strojově vytvořit svou – s velkou nadsázkou řečeno – neoficiální hymnu. Text mu napsal chatovací systém ChatGPT, „logo“ Hrotu nakreslil nástroj Midjourney, za videem stojí programy Runway a Veed, hudbu pak „nazpívala“ neuronová síť Suno. Co na výsledek říkají experti na umělou inteligenci?
Podle matematického lingvisty a odborníka na strojové učení Jiřího Materny je kvalita této písničky stále ještě nevalná, rozdíl oproti rok starým generátorům je ale prý obrovský. „Věřím tomu, že do několika let bude opravdu možné vygenerovat skladbu nerozeznatelnou od lidské tvorby. Kromě toho jsem přesvědčený, že AI bude nejen kopírovat osvědčené vzory a styly, ale bude schopna být i kreativní,“ tvrdí.
Expert poradenské společnosti KPMG na umělou inteligenci Ondřej Michalák pak říká, že motiv skladby působí autenticky, navazování dílčích částí je ale rušivé. „Z díla je zřejmý lidský záměr. AI nemá důvod taková videa vytvářet,“ připomíná s tím, že modely umělé inteligence jsou natrénované z lidských skladeb. „Proto můžeme vygenerovaný song vnímat jen jako jakousi přeměnu předešlých skladeb vytvořenými lidmi, nyní přizpůsobenou záměru nového autora.“
Zatímco v Orwellově dystopii produkoval veršotep ve velkém podřadnou literaturu, hudbu i třeba noviny, podobný scénář ve skutečnosti – alespoň u vysoké kultury – nehrozí. „Nedílnou součástí uměleckého díla je totiž také osobnost autora, jeho životní příběh a podobně. Tento lidský kontext generované tvorbě chybí,“ doplňuje Materna, který je i zakladatelem vzdělávací společnosti Machine Learning College.
Budoucí umělci nebudou mít problém vytvářet nová, originální díla – nikdo jim to, doufejme, zakazovat nebude. Budou mít ale potíže uplatnit se ve veřejném prostoru, protože ten bude stále více zaplaven skutečně nekvalitním obsahem. „Ten budou metaforičtí veršotepové nepochybně hojně vytvářet pomocí AI, protože to bude levnější, rychlejší a jednodušší,“ domnívá se Michalák.
Materna se ovšem domnívá, že hudebníci o práci nepřijdou – žádní roboti je na pódiích nevystřídají. Bez umělců se ale brzy snáze obejdou například reklamní agentury nebo filmoví producenti.
„Proč platit drahého zpěváka a celou mašinérii nahrávání, když postačí zadat příkaz nebo stáhnout již vytvořeno skladbu?“ ptá se expert KMPG a současně připomíná i nedávnou stávku v Hollywoodu, během které herci protestovali proti širšímu využívání AI. „Umělci ale museli i dříve kvůli technologiím upravit svůj byznys model, nicméně jako celek jejich profese nezanikly. Takže i tentokrát čeká toto odvětví nějaká změna – nejspíš v tom směru, že tvůrci přijmou AI jako další (ale ne jediný) nástroj tvorby,“ doplňuje Michalák.
Co se týče videa, tam je umělá inteligence ještě za lidskou tvorbou výrazně pozadu. I v této oblasti se ovšem očekává brzy zvrat. Společnost OpenAI, která stojí za ChatGPT, totiž nyní testuje nový nástroj Sora. Ten už prý umí napodobovat lidské herecké výkony, a to včetně emocí. V rukou ho teď mají vývojáři a akademici, brzy by si ho ale mohla vyzkoušet i široká veřejnost.
Současné nástroje, které dokáží generovat video podle textového popisu, se tomu, co má umět Sora, zdaleka nevyrovnají. Například Runway vytváří jen několikavteřinové záběry nepříliš velké kvality, často navíc nerespektuje zadání uživatele. Podle Materny je však příchod dostupného generátoru videí otázkou měsíců, maximálně několika málo let.
A bude lidem taková „manipulace“ s obrazem vadit? Michalák míní, že pro diváky jsou vždy zajímavé silné příběhy. Ostatně ani teď jim nevadí, když jsou například animované filmy vytvářeny digitálně a drtivou většinu práce na nich tak „odmaká“ počítač, nikoliv člověk. „Díla vygenerovaná AI je třeba vnímat jako kompilát příběhů, z nichž se to umělá inteligence naučila, lidský příběh tak obsahují. A i když je mocným nástrojem, stále za ní vidím přítomnost člověka – minimálně za záměrem a schválením výsledného výstupu,“ uzavírá expert.