Firma vyvíjející uměle inteligentní software OpenAI se na obou březích Atlantiku pustila do razantní soudní obhajoby. Doma čelí žalobě, kterou na ni podalo mocné vydavatelství The New York Times. Žaloba tvrdí, že OpenAI nerespektuje rozhodnutí NYTimes neposkytovat své texty pro trénink velkých jazykových modelů umělé inteligence – v případě OpenAI jde samozřejmě o známého chatbota ChatGPT.
OpenAI v pondělí na svém blogu vydala prohlášení, že trénink jejích modelů na materiálech chráněných autorským právem je povolen v rámci „spravedlivého použití“ a umožňuje také vydavatelům z tohoto procesu vystoupit, což společnost Times učinila v srpnu 2023. „Podporujeme žurnalistiku, spolupracujeme se zpravodajskými organizacemi a věříme, že žaloba New York Times je neopodstatněná,“ uvádí firma.
V témže příspěvku na blogu představila OpenAI svůj přístup k trénování velkých jazykových modelů na obsahu chráněném autorskými právy ze zpravodajských a jiných zdrojů. Poukázala na to, že již uzavřela řadu takových licenčních smluv s řadou mediálních organizací. Jsou mezi nimi například agentura Associated Press nebo německá firma Axel Springer, která vlastní třeba renomovaná média Politico a Business Insider.
Timesy však ve své žalobě uvedly několik příkladů, kdy ChatGPT od společnosti OpenAI téměř doslovně převzal jejich články (i přesto, že NYTimes na spolupráci s OpenAI nepřistoupily). OpenAI poté připustila, že je možné, aby si její modely zapamatovaly části tréninkových dat, ale dodala, že pracuje na tom, aby tomuto „vzácnému selhání“ zabránila.
Společnost také uvedla, že Timesy manipulovaly s příkazy jejímu chatbotovi, aby jej donutily články citovat téměř doslova. Firma též tvrdí, že jednání mezi oběma stranami dosud probíhala konstruktivně – zatímco žaloba NYTimes říká pravý opak.
Žaloba NYTimes je jen jedním z mnoha právních kroků, jimž OpenAI kvůli použití právně chráněných textů čelí. Již v září ji například zažalovalo sedmnáct prominentních spisovatelů (mezi nimi John Grisham, Jodi Picoultová a George R. R. Martin) s obviněním, že OpenAI „krade systematicky a v masovém měřítku“.
OpenAI však zároveň změnila tón, jímž argumentuje před britskou justicí. V podání Sněmovně lordů uvedla, že by bylo nemožné vytvářet nástroje, jako je její přelomový chatbot ChatGPT, bez přístupu k materiálům chráněným autorskými právy. A to z toho důvodu, že prý tlak na firmy zabývající se umělou inteligencí ohledně obsahu používaného k trénování jejich produktů roste.
„Vzhledem k tomu, že autorská práva se dnes vztahují prakticky na všechny druhy lidských projevů – včetně blogů, fotografií, příspěvků na fórech, útržků softwarového kódu a vládních dokumentů –, bylo by nemožné trénovat dnešní špičkové modely umělé inteligence bez použití materiálů chráněných autorskými právy,“ uvedla společnost OpenAI ve svém soudním podání, o němž jako první informoval britský deník Telegraph.
Firma dodala, že omezení tréninkových materiálů na knihy a kresby, na které se nevztahují autorská práva, by vedlo k vytvoření nedostatečně vycvičených systémů umělé inteligence. „Omezení tréninkových dat na knihy a kresby, které byly vytvořeny před více než sto lety, by mohlo přinést zajímavý experiment, ale nedalo by to vzniknout systémům, které by splňovaly potřeby dnešních uživatelů.“
Tento úhel pohledu je docela odlišný od argumentace ve zmíněném blogovém příspěvku. Znamená to tedy jednu ze dvou věcí. Buď OpenAI záměrně volí dvojí typ komunikace, jeden pro americkou a druhý pro evropskou scénu; nebo ve firmě není přesně jasno v tom, jak ve věci ochrany autorských práv postupovat.
Vzhledem k tomu, že se vedení firmy nedávno nemohlo dohodnout ani na tom, kdo je její šéf, je druhá varianta skoro pravděpodobnější.