Nový program pozná autora textu z pouhých dvou set slov

Vědci z Filozofické fakulty Univerzity Palackého v Olomouci vyvinuli technologii, která dokáže pomocí rozboru textu určit jeho autora, jeho psychické rozpoložení či sociální prostředí. Při svém výzkumu analyzovali frekvenci slov v textech spisovatelů, politiků i vrahů a získané poznatky využili při tvorbě postupu pro profilování osob. Technologii lze využít v přizpůsobení internetového obsahu konkrétnímu uživateli, reklamě, personalistice, psychologii, kriminalistice i v oblasti bezpečnosti státu. Novinku už eviduje patentový úřad Spojených států.

Odborníci z katedry obecné lingvistiky FF UP se těmito takzvanými frekvenčními analýzami textu zabývají už několik let, metoda se používá například při určení autorství psaného slova.

Dosud se vědci zaměřovali na slova s vyšší frekvencí výskytu, autoři nové metody ale zvolili odlišný postup. „S kolegy jsme zjistili, že podle nízkofrekventovaných, ale pravidelně rozmístěných, opakujících se slov lze autora poznat také. A co víc, ještě s vyšší mírou jistoty. Už několik let se tedy zaměřujeme na opačné spektrum, na zvláštní skupinu slov v dané slovní zásobě konkrétního člověka,“ uvedl Dan Faltýnek z katedry obecné lingvistiky FF UP.

Metoda je podle lingvistky Martiny Benešové založena na tom, že odborníci v textu hledají jakýsi slovní otisk, který lze použít při analýze a určení autora textu. Například z rozboru mnoha textů Václava Havla vyplynulo, že kladl důraz na slovo „konečně“. „Postupem času jsme vyvinuli technologii, která nám umožňuje najít nízkofrekventovaná klíčová slova, která jsou společně s důrazem na postoj řečníka k určitému tématu otiskem autora,“ podotkl Faltýnek.

Objev je podle něj převratný, protože dosavadní metody takto vysokou jistotu autorství textu nepřinášely. Olomouckým vědcům nyní díky nové technologii stačí analyzovat pouze dvě stě až pět set slov, aby mohli s určitou mírou přesnosti dokázat autorství. Pokud mají k dispozici přibližně 1500 slov, jsou schopni autorství zaručit s velmi vysokou mírou pravděpodobnosti. Dříve si byli jisti až po analýze šesti tisíc slov.

Manifest vraha odhalil motiv i místo činu

Nová technologie podle Benešové dokáže také „extrahovat“ profil lidí. Co to znamená? Slovní zásoba toho o člověku nečekaně moc prozradí – a opakování určitých slov může poukázat na psychický stav člověka nebo jeho sociální prostředí. Vědce například šokovaly výsledky analýzy manifestu amerického vraha, ze které vyplynul jeho motiv i místo následného násilného činu.

Novou technologii lze využít v personalistice, on-line psychoterapii, soudnictví nebo při komunikaci s ohroženými skupinami. Své místo najde také v personalizované reklamě i v boji proti extremismu, terorismu či dezinformacím. Lze ji využít i na obranu proti personalizaci člověka na internetu. „Nejjednodušší variantou využití naší technologie bude v dohledné době aplikace, která lidem umožní dozvědět se něco o sobě a pomůže jim v seberozvoji,“ řekla Benešová.

Výběr redakce

Aktuálně z rubriky Věda

V Chorvatsku našli přes dva tisíce let starou terakotovou hlavu

Chorvatští archeologové a speleologové našli při průzkumu jeskyně Crno jezero na dalmatském poloostrově Pelješac terakotovou hlavu zobrazující starořeckou divadelní masku. Předmět, který lze datovat do 4. až 3. století před naším letopočtem, je uvnitř dutý a v horní části má otvor sloužící k zavěšení, pravděpodobně na zeď. Takové masky jsou často spojovány s divadelními představeními a kultem boha vína Dionýsa, který je považován za patrona divadla. O nálezu informovalo Archeologické muzeum v Dubrovníku.
včera v 08:37

Klimatická změna ukusuje Evropě jaro. Nástup léta začíná být náhlý

Jaro bývá řadou lidí označováno jako jejich nejoblíbenější roční období. Jenže v kontextu prohlubující se změny klimatu pomalu přestává platit stav, kdy je přechod mezi jarem a létem ve střední Evropě příjemně pozvolný.
včera v 07:00

Celosvětový výskyt duševních poruch se od roku 1990 téměř zdvojnásobil, ukazuje studie

Duševních poruch ve světě od roku 1990 téměř dvojnásobně přibylo a v současnosti jimi trpí zhruba 1,2 miliardy lidí. Vyplývá to ze studie Institutu pro měření a vyhodnocování zdravotního stavu (IHME) při Washingtonské univerzitě, kterou ve spolupráci s Queenslandskou univerzitou zveřejnil časopis The Lancet. Výzkum upozorňuje také na výrazný nárůst v Řecku.
22. 5. 2026

Vědci z Lille vyvíjejí mužské antikoncepční tělísko, na trhu by mohlo být do roku 2033

Vyvíjené mužské antikoncepční tělísko je „malou svorkou“, která se zavádí během patnácti minut v lokální anestezii. Její antikoncepční účinek je čistě mechanický a mohl by trvat až tři roky.
22. 5. 2026
Načítání...