Umělé inteligence se zlepšují ve lhaní. Může to být nebezpečné, varují experti

V italské lidové pohádce se dřevěný, ale inteligentní panáček Pinocchio vyznačoval tím, že byl velmi špatný lhář. Pokaždé, když řekl nějakou nepravdu, o něco mu povyrostl nos. Dnešní umělé inteligence takový problém nemají. Za několik posledních let dosáhly obrovského pokroku ve všech oblastech. Včetně právě lhaní, upozornila nová studie.

Analýza vědců z Massachusettského technologického institutu (MIT) popsala případy, kdy systémy umělé inteligence podváděly své lidské oponenty, dokázaly blafovat a úspěšně předstírat, že jsou lidé. Jeden zkoumaný chatbot dokonce změnil své chování během bezpečnostních testů, což podle autorů zvyšuje riziko, že AI budou umět lidi přelstít poměrně snadno.

„S tím, jak budou schopnosti systémů AI lhát stále dokonalejší, bude nebezpečí, které představují pro společnost, stále vážnější,“ komentoval výsledky zkoumání autor studie Peter Park.

Lež jako cesta k vítězství

Park se rozhodl prověřit schopnosti AI lhát poté, co se dozvěděl o tom, jak je úspěšná ve stolní hře Diplomacy. Umělá inteligence Cicero od společnosti Meta se naučila, jak v ní porazit většinu lidských soupeřů – a protože je v této dobyvatelské strategii zapotřebí umět lhát a podvádět, musela si to osvojit.

AI to dokázala, přestože byla navržená tak, aby byla „převážně čestná“ a nikdy nepodrazila své lidské spoluhráče. Jenže k vítězství to nestačilo – a tak lhala. Park a jeho kolegové prošli veřejně dostupná data o hrách Cicera proti lidem a našli v nich několik případů, kdy umělá inteligence promyšleně lhala, pletichařila s hráči proti jiným, a dokonce maskovala svou AI povahu, když se jinému hráči omlouvala za zpoždění slovy, že „telefonovala se svou přítelkyní“. „Zjistili jsme, že umělá inteligence Meta se naučila mistrovsky podvádět,“ potvrzuje Park.

Jeho tým pak popsal podobné schopnosti i u jiných systémů AI, například u programu pro poker Texas Hold 'em, který dokázal blafovat proti profesionálním lidským hráčům. V jedné studii si umělé inteligence v digitálním simulátoru dokonce „hrály na mrtvé“, aby tak oklamaly test sestavený k eliminaci systémů umělé inteligence, které se vyvinuly k rychlému replikování. Po skončení testování obnovily svou původní činnost. To je podle autorů výjimečně znepokojivé, protože to ukazuje, jak složité mohou už brzy být snahy umělé inteligence kontrolovat.

Podle Parka to může mít zásadní důsledky. „To, že se systém umělé inteligence považuje za bezpečný v testovacím prostředí, ještě neznamená, že je bezpečný i potom v ostrém provozu. Může se stát, že v testovacím prostředí jenom předstírá, že je bezpečný,“ upozornil Park.

Vědci tyto nové informace zveřejnili v odborném žurnálu Patterns. Současně v článku vyzvali vlády, aby navrhly zákony o bezpečnosti umělé inteligence, které by se věnovaly právě problému podvodů ze stran AI. Varují mimo jiné před tím, že pokud tyto systémy dokáží svou schopnost lhát ještě více zdokonalit, mohli by nad nimi lidé snadno ztratit kontrolu.


Výběr redakce

Aktuálně z rubriky Věda

Nová varianta covidu „cikáda“ odolávající protilátkám se dostala už i do Česka

Nově se šířící varianta viru SARS-CoV-2 se liší od těch předchozích tolik, že by mohla snadněji unikat očkování i předchozímu překonání covidu. Upozorňují na ni experti ve více zemích včetně Česka. Pokud by se šířila dál, bylo by zřejmě potřeba změnit očkování.
před 19 hhodinami

VideoČeští experti zkoumají čínského robota Karla

Odborníci ze spolku Česká IT akademie zkoumají čínského humanoidního robota jménem Karel. Objevují, jak technologie funguje, i to, co všechno tito roboti dokážou o svých uživatelích zjistit. S čínskými technologiemi se totiž dlouhodobě spojují rizika spojená se sledováním i sběrem dat. Podle Ondřeje Chlupáčka z akcelerátoru S-tech Ventures je jedním z cílů zkoumání zjistit, jaké komponenty lze nahradit evropskými alternativami a jak by to bylo drahé či složité. Kromě toho odborníci učí Karla správně používat jeho ruce. V budoucnu by pak roboti mohli nahradit lidské pracovníky třeba ve zdravotnictví nebo průmyslu.
27. 3. 2026

Wikipedie omezila používání AI, povoluje už jen drobné úpravy a překlady

Otevřená internetová encyklopedie Wikipedie zakázala používání umělé inteligence při tvorbě nebo přepisování článků. Podle nových pravidel smí editoři používat jazykové modely, například ChatGPT, Google Gemini nebo DeepSeek, pouze výjimečně. Texty vytvořené těmito nástroji totiž často porušují základní zásady encyklopedie, zejména požadavek na ověření ze spolehlivých zdrojů.
27. 3. 2026

Vědci testují očkování proti fentanylu. Může zabránit vzniku „zombií“

Epidemie fentanylové závislosti se rozšířila už tak moc, že vědci hledají řešení, která by ještě nedávno nebyla ve hře. Jedním z nich by mohlo být například očkování, které „vypne“ v mozku centra, jež reagují na tuto drogu. Testování této vakcíny už začalo.
27. 3. 2026

Družice AMBIC bude očima Česka v kosmu. Má sledovat povodně, požáry či dopravu

Zástupci národního centra pro letectví a vesmír VZLU Aerospace a Evropské kosmické agentury (ESA) v pátek podepsali smlouvu, která zajistí vývoj družice AMBIC. Ta by v budoucnu měla pomoci mimo jiné při zvládání požárů a povodní nebo sledování situace na silnicích a železnicích.
27. 3. 2026

Blíží se „super El Niño“, predikují experti. Může přinést nejteplejší rok vůbec

Nová měření naznačují, že letos zřejmě převládne teplá fáze teploty oceánské vody, které se říká El Niño. To by mohlo mít závažné dopady na počasí ve velké části světa.
27. 3. 2026

Co se stane, když naklonujete klon? Vědci narazili na bariéru

Před jednatřiceti lety lidé poprvé viděli klon. Ovce Dolly byla první, ale nikoliv poslední, od té doby se tento proces používá běžně v mnoha oblastech vědy. Ve vzduchu ale stále visí jedna otázka: Dá se klonovat nekonečně, nebo existuje mez, kdy to přestává fungovat? Teď tuto hranici našli japonští biologové.
27. 3. 2026
Doporučujeme

Pes je nejlepším přítelem člověka o tisíce let déle, než se předpokládalo

Pes je nejlepším přítelem člověka už nejméně šestnáct tisíc let, prokázala dvojice studií, které vyšly tento týden v odborném žurnálu Nature. Vědci tak výrazně posunuli datum doby, kdy se psi prokazatelně vyskytovali s lidmi v Eurasii – a to přibližně o pět tisíc let směrem do minulosti.
26. 3. 2026
Načítání...