Jedním z velkých problémů se cvičením modelů generativní AI je, že výsledek nelze předvídat. Navzdory všeobecně rozšířenému přesvědčení, že se časem prostřednictvím různých aktualizací zlepší a zpřesní, se stal pravý opak. Přesnost OpenAI ChatGPT se v poslední verzi prudce snížila.
Jakmile se data jednou dostanou dovnitř, nelze říct, kam se dostanou dále. Na začátku roku se o tom přesvědčila třeba společnost Amazon, když si všimla, že ChatGPT v odpovědích odhaluje její citlivé interní údaje. Jak to? Inu, inženýři Amazonu testovali ChatGPT tak, že mu dodávali interní data a žádali ho, aby je (data, ne inženýry) analyzoval. A skutečně, robot je analyzoval a poučil se z nich. A pak se bezstarostně podělil o to, co se dozvěděl, s každým, kdo se zeptal.
Souhlasíte s tím, že…
Představte si tedy typický hovor v aplikaci Zoom. Podniky ji používají pro interní schůzky, kde se podrobně probírají nejcitlivější plány a problémy. Lékaři ji používají k diskusím o pacientech. Na přetřes přijdou fúze a akvizice, rozvody, investice, tajné erotické schůzky, tipy na dostihy – veškerá směsice běžného s důvěrným, z níž sestává lidská komunikace.
A všechno to patří Zoomu
Takhle to popisují jeho modifikované podmínky: „Zákaznický obsah nezahrnuje žádné telemetrické údaje, údaje o používání produktů, diagnostické údaje a podobný obsah nebo údaje, které společnost Zoom shromažďuje nebo generuje v souvislosti s používáním služeb nebo softwaru vámi nebo vašimi koncovými uživateli. Mezi vámi a společností Zoom platí, že veškerá práva, vlastnické právo a podíl na datech generovaných službou a veškerá vlastnická práva k nim náleží a zůstávají výhradně společnosti Zoom. Souhlasíte s tím, že společnost Zoom sestavuje a může sestavovat data generovaná službou na základě obsahu zákazníka a používání služeb a softwaru. Souhlasíte s tím, aby společnost Zoom měla přístup k datům generovaným službou, používala je, shromažďovala, vytvářela, upravovala, distribuovala, zpracovávala, sdílela, udržovala a ukládala za jakýmkoli účelem, v rozsahu a způsobem povoleným podle platných právních předpisů, včetně za účelem vývoje produktů a služeb, marketingu, analytiky, zajištění kvality, strojového učení nebo umělé inteligence (včetně za účelem školení a ladění algoritmů a modelů), školení, testování, zlepšování služeb, softwaru nebo jiných produktů, služeb a softwaru společnosti Zoom nebo jejich kombinace, a jak je jinak stanoveno v této smlouvě.“
To například znamená, že Zoom vám nebude měřit sítnici, a pokud ano, nebude ten údaj prodávat jiným firmám. Ale to, o čem si povídáte? Inu, to je fair game. Až budete mít prvorozeného syna, určitě bude Zoomu patřit také. A bude si s ním moci dělat, co vedení firmy napadne:
„Společnost Zoom může obsah zákazníka dále distribuovat, zveřejňovat, importovat, zpřístupňovat, používat, ukládat, přenášet, prohlížet, zveřejňovat, uchovávat, extrahovat, upravovat, reprodukovat, sdílet, používat, zobrazovat, kopírovat, distribuovat, překládat, přepisovat, vytvářet odvozená díla a zpracovávat: Souhlasíte s tím, že společnosti Zoom tímto udělujete trvalou, celosvětovou, nevýhradní, bezplatnou, sublicencovatelnou a převoditelnou licenci a veškerá další práva potřebná nebo nezbytná k redistribuci, publikování, importu, přístupu, používání, ukládání, přenosu, přezkoumávání, odhalování, uchovávání, extrakci, úpravě, reprodukci, sdílení, používání, zobrazování, kopírování, distribuci, překladu, přepisu, vytváření odvozených děl a zpracování obsahu zákazníka a k provádění všech úkonů týkajících se obsahu zákazníka, které mohou být nezbytné k tomu, aby vám společnost Zoom mohla poskytovat služby, včetně podpory služeb; (ii) za účelem vývoje produktů a služeb, marketingu, analýzy, zajištění kvality, strojového učení, umělé inteligence, školení, testování, zlepšování Služeb, Softwaru nebo jiných produktů, služeb a softwaru společnosti Zoom nebo jejich kombinace; a (iii) za jakýmkoli jiným účelem souvisejícím s jakýmkoli použitím nebo jiným úkonem povoleným v souladu s oddílem 10. 3. “
A pak, snad pro zasmání, podmínky uvádějí: „Bez ohledu na výše uvedené nebude společnost Zoom používat audio, video nebo chatový obsah zákazníka k trénování našich modelů umělé inteligence bez vašeho souhlasu.“
Mezery a protimluvy
Existují zde mezery a protimluvy (Zoom Contradicts Its Own Policy About Training AI On Your Data (gizmodo.com). Zaprvé, Zoom se hájí tím, že tvrdí, že pod pojmem Service Generated Data (údaje vzniklé využíváním jeho služeb) rozumí metadata – tedy údaje o tom, kdy, jak dlouho, jak často a s kým mluvíte.
To je bizarní. Je zjevné, že vy coby klient víte pouze o svých metadatech, tedy komunikačních zvycích. Zoom tedy nemá zapotřebí chránit tuto vědomost zvláštní klauzulí (ledaže by chtěl, abyste zapomněli i svá vlastní data). Naopak na druhé straně explicitně tvrdí, že bez vašeho souhlasu nebude používat obsah vašich konverzací, ačkoli na jiném místě tvrdí, že o ten mu nejde vůbec.
Pak je tu formulace „bez vašeho souhlasu“. Na základě všech výše uvedených skutečností je takový souhlas udělen pouhým používáním výrobku. Časopis Computerworld opakovaně žádal Zoom, aby uvedl, kam (na webu nebo v mobilní aplikaci) mohou uživatelé přejít, aby odvolali souhlas s jakýmkoli školením AI. Žádná odpověď. Takové odvolání souhlasu nabízejí pro několik velmi omezených služeb, jako je například shrnutí poznámek ze schůzky. Ale celkově? Nic.
Mechanismus souhlasu s používáním produktu je problematický zejména pro nezákazníky. Řekněme, že podnik zaplatí a uspořádá hovor a pak pozve zákazníky, některé dodavatele a další partnery, aby se schůzky zúčastnili. Chápou tito hosté, že vše, co řeknou, může být předáno generativní umělé inteligenci? Jak má host kromě odmítnutí účasti odmítnout souhlas?
Další mezera se týká slova „obsah“. Jak Zoom popisuje, existuje spousta metadat a dalších informací, které shromažďuje a které nepovažuje striktně za obsah. Společnost Zoom o tom hovořila v příspěvku na svém blogu: „Existují určité informace o tom, jak naši zákazníci souhrnně používají náš produkt – telemetrie, diagnostické údaje atd. Tyto údaje se běžně označují jako data generovaná službou. Chtěli jsme být transparentní v tom, že je považujeme za naše data.“
Když se vám to nelíbí, jděte
Zoom se hájí. V pondělí 7. srpna v blogovém příspěvku zdůraznil, že „správci schůzek se mohou odhlásit od sdílení dat ze souhrnů schůzek se společností Zoom. Členové schůzek, kteří nejsou administrátory, jsou o nových zásadách sdílení dat společnosti Zoom informováni a mají možnost schůzky přijmout nebo opustit“.
Obhájcům ochrany osobních údajů – včetně mnohých uživatelů Zoomu – to zhusta nestačí. Někteří uživatelé prohlásili, že zruší své účty u společnosti Zoom, zatímco jiní požadují, aby společnost Zoom změnila své podmínky nebo nabídla všem, nejen správcům schůzek, možnost odmítnout používání svých údajů pro trénink umělé inteligence.
Aric Toler, ředitel pro školení a výzkum ve společnosti Bellingcat, uvedl, že jeho firma nebude ani po opětovném ujištění Zoomu služby řečené firmy využívat.
„Je lepší se s nimi rozejít teď než později, až dojde k dalšímu znepokojivému vývoji,“ řekl Toler. Bellingcat se dosud spoléhala na Zoom při pořádání školicích seminářů a webinářů pro stovky novinářů, výzkumníků a studentů, uvedl Toler. Řekl, že firma se bude zabývat dalšími platformami pro videokomunikaci, jako jsou Jitsi Meet, Google Meet a Microsoft Teams, a přezkoumá jejich zásady stran nakládání s daty.
Bogdana Raková z neziskovky přes AI Mozilla Foundation řekla, že lidé nevěnují pozornost podmínkám služeb a ne vždy jsou si jejich změn vědomi. Podmínky služby společnosti Zoom byly změněny v březnu a vstoupily v platnost 27. července; trvalo tedy přes čtyři měsíce, než veřejnost ony skandální nehoráznosti zaregistrovala. „Jsou to dokumenty, které jsou záměrně napsány tak, aby žádný příčetný člověk netrávil čas jejich prohlížením,“ řekla Raková.
Jednoznačné poučení
Co tedy? Existuje vůbec někdo v oboru videohovorů a konferencí, kdo podobné nehoráznosti nedělá? Microsoft? Google? Přesnou odpověď neznáme, ale víme, že jsou to firmy, které se nikdy nesetkaly s datovou sadou, která by se jim nelíbila.
Poučení je jednoznačné – a není nijak nové. Nic z toho, co zazní na schůzce přes Zoom (stejně jako přes kterýkoli jiný elektronický komunikační kanál, když jsme u toho), nemůžete považovat za soukromé, nebo dokonce za bezpečné.