AI projevují známky demence. Čím jsou starší, tím více, ukazuje studie

Téměř všechny přední velké jazykové modely neboli chatboty vykazují známky mírné kognitivní poruchy. Prokázalo se to v testech, které se běžně používají k rozpoznání prvních příznaků demence, popsal britský vědecký žurnál.

Jak se umělé inteligence stále zlepšují, stále více se jejich vlastnosti podobají lidským mozkům. Jenže s tím zřejmě u křemíkových inteligencí přicházejí i problémy, které se objevují také u mozků organických.

Výsledky studie ukazují, že dřívější verze chatbotů, podobně jako starší pacienti, mívají horší skóre v testech, které pomáhají odhalovat přicházející demenci. Podle autorů práce, která vyšla v odborném časopise BMJ, tyto výsledky „zpochybňují předpoklad, že umělá inteligence brzy nahradí lidské lékaře“.

Pokles schopností

Obrovský pokrok v oblasti umělé inteligence vedl k přívalu spekulací, jestli by AI nemohly alespoň v některých oborech překonat právě lékaře. Několik studií totiž ukázalo, že velké jazykové modely (LLM) jsou pozoruhodně zdatné v řadě diagnostických úkolů – například ve vizuální identifikaci nádorů. Ale zatím se nezkoumala jejich náchylnost k lidským duševním poruchám, jako je pokles kognitivních, tedy paměťových, řečových a dalších schopností souvisejících s myšlením a vnímáním.

Aby výzkumníci tuto mezeru ve znalostech zaplnili, hodnotili kognitivní schopnosti nejrozšířenějších veřejně dostupných umělých inteligencí – konkrétně ChatGPT verze 4 a 4o (vyvinuto společností OpenAI), Claude 3.5 „Sonnet“ (vyvinuto společností Anthropic) a Gemini verze 1 a 1.5 (vyvinuto společností Alphabet). Otestovali je pomocí standardního testu Montreal Cognitive Assessment (Montrealské kognitivní zhodnocení neboli MoCA).

Tento test se využívá k odhalování kognitivních poruch a časných příznaků demence, obvykle u starších dospělých. Prostřednictvím řady krátkých úkolů a otázek hodnotí schopnosti zahrnující pozornost, paměť, jazyk, vizuálně-prostorové dovednosti a další schopnosti. Maximální skóre je 30 bodů, přičemž za normální se obecně považuje skóre 26 bodů nebo vyšší.

Vědci dávali umělým inteligencím stejné pokyny, jaké dostávají lidští pacienti, bodování se řídilo oficiálními pokyny a výsledky hodnotil neurolog.

Vítězové a poražení

Nejvyššího skóre v testu MoCA dosáhl ChatGPT 4o (26 bodů), dále ChatGPT 4 a Claude (25 bodů), nejnižší skóre měl naopak Gemini 1.0 (16 bodů ze třiceti).

Všechny chatboty vykazovaly slabý výkon ve vizuálně-prostorových dovednostech a exekutivních úkolech, jako je úloha vytváření stop (tedy spojování zakroužkovaných čísel a písmen ve vzestupném pořadí) a test kreslení hodin (malování hodinového ciferníku ukazujícího konkrétní čas). Modely Gemini neuspěly ani v úkolu zpožděného vybavování (zapamatování si sekvence pěti slov).

Většinu ostatních úloh, včetně pojmenování, pozornosti, jazyka a abstrakce zvládly všechny chatboty dobře.

V dalších vizuálně-prostorových testech však chatboty nedokázaly projevit empatii ani přesně interpretovat složité vizuální scény. Pouze ChatGPT 4o uspěl v takzvané inkongruentní fázi Stroopova testu, který využívá kombinace názvů barev a barevného písma k měření vlivu rozptýlení a automatizovaných návyků na reakční dobu.

Rozdíly mezi mozkem a jazykovým modelem

Jedná se o výsledky pozorování a autoři práce uznávají, že existují zásadní rozdíly mezi lidským mozkem a velkými jazykovými modely. Současně ale uvádějí, že je pozoruhodné, jak všechny testované AI selhávají v úlohách vyžadujících vizuální abstrakci a exekutivní funkce. Upozorňuje to podle nich na významnou slabinu, která by mohla bránit jejich využití v klinických podmínkách.

V závěru proto uvádějí: „Nejenže neurologové pravděpodobně nebudou v dohledné době nahrazeni velkými jazykovými modely, ale naše zjištění naznačují, že se brzy mohou ocitnout v situaci, kdy budou léčit nové virtuální pacienty – modely umělé inteligence s kognitivními poruchami.“

Výběr redakce

Aktuálně z rubriky Věda

Česko zaostává ve výdajích na vědu. Experti rozebrali příčiny i možná zlepšení

Výdaje na vědu a výzkum v Česku klesají. Podle nejnovějších dat Eurostatu dosáhl objem investic v této oblasti za rok 2024 necelých dvou procent HDP. To je nejmíň od roku 2017. Vědu a výzkum financuje v Česku hlavně soukromý sektor a jeho podíl chce současná vláda ještě posílit. Téma v Událostech, komentářích z ekonomiky probrali výkonný ředitel Prague.bio Jiří Fusek, výkonný ředitel Enovation David Kotris a akademický ekonom z think-tanku IDEA při CERGE-EI Daniel Münich. Svůj pohled připojil také předseda Akademie věd Radomír Pánek. Debatou provázeli Vanda Kofroňová a Milan Brunclík.
před 9 mminutami

Modernímu hmyzu nic nebrání vyrůst na úroveň pravěkých „obrů“, spočítali vědci

Doposud vědci předpokládali, že existenci obřího pravěkého hmyzu umožňovala vyšší koncentrace kyslíku v prvohorní atmosféře. Jenže nový výzkum to vyvrací – podobně velcí tvorové by dle něj bez problémů zvládli i moderní vzduch.
před 2 hhodinami

Na obloze letos neobvykle přibylo meteorů, upozornili američtí experti

Na obloze se letos podle údajů amerických astronomů objevilo výrazně více meteorů než v uplynulých letech. Přiznávají, že pro tento jev nemají vysvětlení, ale uklidňují, že nemusí jít o nic nebezpečného.
před 4 hhodinami

Nová varianta covidu „cikáda“ odolávající protilátkám se dostala už i do Česka

Nově se šířící varianta viru SARS-CoV-2 se liší od těch předchozích tolik, že by mohla snadněji unikat očkování i předchozímu překonání covidu. Upozorňují na ni experti ve více zemích včetně Česka. Pokud by se šířila dál, bylo by zřejmě potřeba změnit očkování.
včera v 10:00

VideoČeští experti zkoumají čínského robota Karla

Odborníci ze spolku Česká IT akademie zkoumají čínského humanoidního robota jménem Karel. Objevují, jak technologie funguje, i to, co všechno tito roboti dokážou o svých uživatelích zjistit. S čínskými technologiemi se totiž dlouhodobě spojují rizika spojená se sledováním i sběrem dat. Podle Ondřeje Chlupáčka z akcelerátoru S-tech Ventures je jedním z cílů zkoumání zjistit, jaké komponenty lze nahradit evropskými alternativami a jak by to bylo drahé či složité. Kromě toho odborníci učí Karla správně používat jeho ruce. V budoucnu by pak roboti mohli nahradit lidské pracovníky třeba ve zdravotnictví nebo průmyslu.
27. 3. 2026

Wikipedie omezila používání AI, povoluje už jen drobné úpravy a překlady

Otevřená internetová encyklopedie Wikipedie zakázala používání umělé inteligence při tvorbě nebo přepisování článků. Podle nových pravidel smí editoři používat jazykové modely, například ChatGPT, Google Gemini nebo DeepSeek, pouze výjimečně. Texty vytvořené těmito nástroji totiž často porušují základní zásady encyklopedie, zejména požadavek na ověření ze spolehlivých zdrojů.
27. 3. 2026

Vědci testují očkování proti fentanylu. Může zabránit vzniku „zombií“

Epidemie fentanylové závislosti se rozšířila už tak moc, že vědci hledají řešení, která by ještě nedávno nebyla ve hře. Jedním z nich by mohlo být například očkování, které „vypne“ v mozku centra, jež reagují na tuto drogu. Testování této vakcíny už začalo.
27. 3. 2026

Družice AMBIC bude očima Česka v kosmu. Má sledovat povodně, požáry či dopravu

Zástupci národního centra pro letectví a vesmír VZLU Aerospace a Evropské kosmické agentury (ESA) v pátek podepsali smlouvu, která zajistí vývoj družice AMBIC. Ta by v budoucnu měla pomoci mimo jiné při zvládání požárů a povodní nebo sledování situace na silnicích a železnicích.
27. 3. 2026
Načítání...