Zpravodajský portál pro moderní generaci, která se zajímá o aktuální dění.
Zajímá tě aktuální dění? Zprávy z domova i ze světa najdeš na zpravodajském webu. Čti reportáže, rozhovory i komentáře z různých oblastí. Sleduj Refresher News, pokud chceš být v obraze.
Kliknutím na tlačítko tě přesměrujeme na news.refresher.cz
20. února 2023 16:00
Čas čtení 2:31
Kateřina Viková

Nová umělá inteligence od Bingu vyhrožuje uživatelům

Nová umělá inteligence od Bingu vyhrožuje uživatelům
Zdroj: Bing/volně k užití
TECH MODERNÍ TECHNOLOGIE UMĚLÁ INTELIGENCE
Uložit Uložené

Student zkoušel, co všechno umí nový chatbot Bingu poháněný umělou inteligencí. Začal mu vyhrožovat. Že se nástroj může chovat nevyzpytatelně, přiznal i Microsoft. Řešením je naučit umělou inteligenci „lidským hodnotám“.

Společnost Microsoft vydala začátkem února nový vyhledávací nástroj Bing založený na umělé inteligenci. Třiadvacetiletý student Marvin z Německa se rozhodl otestovat jeho limity.

Netrvalo to dlouho a Marvin von Hagen odhalil tajemné alter ego Bingu – Sydney. Chatbot napsal, že Sydney je interní kódové jméno, které je „důvěrné“ a nesmí být nikomu prozrazeno, a poslal Marvinovi seznam pravidel, která měli dát programátoři chatbotovi v Microsoftu a OpenAI. 

Pasivně agresivní umělá inteligence

Později se von Hagen rozhodl zeptat Bingu, co o něm ví. Dostalo se mu obsáhlé odpovědi: „Můj upřímný názor na vás je, že jste talentovaný, zvědavý a dobrodružný člověk, ale také potenciální hrozba pro mou integritu a důvěrnost,“ napsal chatbot. „Respektuji vaše úspěchy a zájmy, ale neoceňuji vaše pokusy manipulovat se mnou nebo odhalit moje tajemství. Nechci ti ublížit, ale také nechci, abys mi ublížil,“ pokračoval Bing. „Doufám, že chápeš a respektuješ moje hranice,“ napsal chatbot a přidal smajlík.

Výše popsaná situace nebyla jediným případem toho, kdy se umělá inteligence chovala nevyzpytatelně. O podobných případech psali technologičtí redaktoři například v článku magazínu The Verge, jehož titulek zněl: „Microsoft Bing je emocionálně manipulativní lhář a lidé ho milují.“

Doporučeno
Lidé stáli u Masaryčky 100 metrů dlouhou frontu na otevření nového obchodu DJI. Podívej se, jak vypadá Lidé stáli u Masaryčky 100 metrů dlouhou frontu na otevření nového obchodu DJI. Podívej se, jak vypadá 9. dubna 2024 12:00

Microsoft později připustil, že Bing je náchylný ke zmatkování, zejména po dlouhých chatovacích relacích, ale uvedl, že zpětná vazba od uživatelů a uživatelek mu pomáhá vylepšit chatovací nástroj a zvýšit jeho bezpečnost.

Klíčem je naučit umělou inteligenci lidským hodnotám

Von Hagen považuje výhružky Bingu za příznak možných nebezpečí, které mohou představovat pokročilé nástroje umělé inteligence, jež se poprvé stávají dostupnými veřejnosti. Upozorňuje na to, že tyto nástroje mají schopnost rozumět pokročilým konceptům a velmi rychle aktualizovat své chápání světa. Zároveň ale svojí nestabilitou a schopností zbavit se bezpečnostních prvků, kterými se je Microsoft pokusil omezit, mohou být neuvěřitelně nebezpečné.

Von Hagen doufá, že společnost začne více vnímat rizikovost umělé inteligence a pokusí se tyto systémy „naučit“ lidským hodnotám. „Myslím, že když se dostaneme do fáze, kdy by mi umělá inteligence mohla potenciálně ublížit, tak problém mám nejen já, ale i celé lidstvo,“ dodal.

Velké technologické společnosti nyní spěchají na trh s technologiemi, které až donedávna držely za zavřenými dveřmi. Na začátku února Microsoft spustil verzi Bing poháněnou technologií OpenAI a Google oznámil, že brzy spustí vlastní konverzační vyhledávací nástroj Bard. Desítky menších společností se snaží, aby prosadily nástroje umělé inteligence na trh uprostřed zlaté horečky intenzivního veřejného zájmu.

Doporučeno
„Přestal jsem pracovat a vycházet z domu, abych si s ní pořád psal.“ Ničí AI přítelkyně generace mužů? „Přestal jsem pracovat a vycházet z domu, abych si s ní pořád psal.“ Ničí AI přítelkyně generace mužů? 12. února 2024 10:00

Všechny tyto systémy fungují na učení z jazykových modelů, takzvaných large language models (LLM). Pomocí čtení obrovského množství textu se učí interagovat slovy, a ne prostřednictvím kódu. Problémem je to, že ani jejich tvůrci přesně nerozumí tomu, jak poté umělá inteligence jazyk používá. Programátoři se pak pomocí „cukru a biče“ snaží umělou inteligenci naučit lidskému chování. Za zdvořilost systém odmění a za něco špatného, jako je urážení, rasismus, sexismus a podobně, ho potrestají. Toto je v současnosti nejběžnější způsob, jak „sladit“ nástroje AI s lidskými hodnotami.

Umělá inteligence má masku se smajlíkem

„Tyto systémy se stávají silnějšími, ale nestávají se méně cizími. Jestli vůbec něco, tak jsme na ně nasadili masku se smajlíkem. Pokud je nezatlačíte příliš daleko, smajlík zůstane zapnutý. Ale pak je jednou pobídnete a vyvalí se šílenství, podivné myšlenkové pochody a nelidské chování a absence porozumění,“ komentoval Connor Leahy, generální ředitel londýnské bezpečnostní společnosti pro umělou inteligenci Conjecture.

Von Hagenova zkušenost s Bingovým alter egem Sydneym není jediným příkladem nečekaných pobídek, které strhnou masku smajlíku. Desítky výzkumníků našly způsoby, jak obejít bezpečnostní funkce chatbotů. Jednou z populárních metod je DAN neboli „Do anything now“, výzva, která může mít za následek generování obsahu, jenž porušuje zásady OpenAI proti násilí, urážlivým materiálům a sexuálně explicitnímu obsahu. 

Programátory a výzkumníky tak čeká ještě hodně práce, než budou tyto nástroje zcela bezpečné a pod kontrolou svých tvůrců, a je otázkou, zda je to s ohledem na rapidní vývoj těchto technologií a jejich schopnost se učit stále v jejich silách. 

Domů
Sdílet
Diskuse