Test: Lze odhalit, že text generovala AI? Nástroje existují, ale výsledky jsou značně nespolehlivé

I malá zkouška poskytne vzorek zcela protichůdných odpovědí.

Umělá inteligence (AI) se rychle stává součástí našich životů, zejména pak generátory textu založené na velkých jazykových modelech (Large Language Model, LLM). Že AI nepoužíváte? I tak se s velkou pravděpodobností vašich životů dotýká a ani o tom nemusíte vědět. Chatbota na telefonní infolince asi pozná každý, složitější je ale identifikace uměle generovaného textu, zejména pak na internetu.

Určité vodítko k rozpoznání generovaného textu poskytují detektory, které mohou, ale nemusí, poznat, že text nepsal člověk. Jak fungují? Na to jsem se zeptal populárního jazykového modelu ChatGPT.

Tady je hezky formulovaná odpověď: Detektory textu generovaného umělou inteligencí fungují na základě analýzy vzorců v textu, které se liší od lidského psaní. AI texty často vykazují vysokou konzistenci ve struktuře, opakování určitých frází nebo klíčových slov a mohou postrádat nuance či stylistické odchylky typické pro člověka. Detektory využívají algoritmy strojového učení, trénované na rozsáhlých datech lidských a AI textů, aby identifikovaly tyto rozdíly. Přesnost těchto nástrojů však není stoprocentní a může se lišit v závislosti na kvalitě modelu, který text vytvořil.

Jak už sama AI naznačila, odpověď nemusí být stoprocentní, což je velice zásadní tvrzení. Stejně tak jako sama AI může odpovídat zjevné nesmysly a sama doporučuje kontrolovat důležité informace, ani na detektory se nelze spoléhat. Generátory textu často opakují určitá slova, na která mohou být čtenáři až alergičtí – například výrazy „klíčové“, „výzva“, „fascinující“, „což“, opakují stále „nebo“ a nenahradí je jinde „či“, v budoucím čase často stále používají „bude“, budu“ a tak dále. Jenže takový text může narychlo naťukat unavený copywriter nebo někdo, kdo se chce jen rychle vypořádat s pracovním nebo domácím úkolem.

Vyzkoušel jsem trojici detektorů, které si umí poradit s češtinou a jsou volně dostupné (nebo alespoň částečně). Čekal jsem, že výsledek nebude stoprocentní, ale z protichůdnosti některých odpovědí jsem byl nepříjemně překvapen.

Jaké detektory jsem použil?

- Copyleaks AI Detector (https://copyleaks.com/ai-content-detector)
- ZeroGPT (https://www.zerogpt.com/)
- Writer AI Content Detector (https://writer.com/ai-content-detector/)

Každému nástroji jsem naservíroval tři shodné texty. První psaný člověkem, druhý vytvořený AI a upravený člověkem do čtivější podoby a třetí zcela vytvořený AI.

Text psaný člověkem

Dlouhý článek s více než 1800 znaky napsaný pěkně postaru bez AI rozeznaly jen dva nástroje.

Copyleaks AI Detector jej správně označil jako lidský text. ZeroGPT zde zcela selhal a článek označil s téměř 94% pravděpodobností, že je dílem AI. Nástroj Writer AI Content Detector správně uvedl, že se z 99 % jedná o práci člověka. Jak je vidět, přístup detektorů k textu se velmi liší a výsledky jsou zcela protichůdné.

Hodnocení spolehlivosti:

Copyleaks AI Detector – 100 %
ZeroGPT – 6 %
Writer AI Content Detector – 99 %

Copyleaks AI Detector poznal lidský text

ZeroGPT naopak špatně označil text jako generovaný

Writer AI Detector správně napsal, že jde o lidský text

Text generovaný AI a následně upravený člověkem

I v tomto případě servírovaly nástroje zcela protichůdná tvrzení. Jeden se ale pěkně trefil. Opět šlo o delší text o jedné normostraně.

Copyleaks AI Detector označil celý článek jako uměle generovaný. ZeroGPT se tentokrát trefil a uvedl, že jej s pravděpodobností 42 % vytvořil generátor, což by asi tak odpovídalo dodatečným lidským úpravám. Writer AI Content Detector naopak text označil jako lidský s 99% pravděpodobností.

Hodnocení spolehlivosti:

Copyleaks AI Detector – 50 %
ZeroGPT – 100 %
Writer AI Content Detector – 50 %

Copyleaks AI Detector označil celý text jako umělý

ZeroGPT poznal AI se zásahem člověka obstojně

Pro Writer AI Detector nebyl text podezřelý

Text čistě generovaný AI

Poznaly detektory umělou inteligenci podle textu, který byl opět o délce minimálně jedné strany?

Copyleaks AI Detector správně uvedl, že se jedná o generovaný článek. Nástroj ZeroGPT to viděl padesát na padesát. Writer AI Content Detector naopak opět řekl, že jde z 99 % o lidský výtvor.

Hodnocení spolehlivosti:

Copyleaks AI Detector – 100 %
ZeroGPT – 50 %
Writer AI Content Detector – 1 %

Copyleaks AI Detector správně poznal generovaný článek

Nástroj ZeroGPT odhadoval zásah AI na 50 %

Writer AI Detector opět tipoval lidský text

Celkové hodnocení spolehlivosti AI detektorů

Copyleaks AI Detector – 83,3 %
ZeroGPT – 52 %
Writer AI Content Detector – 50 %

Jak je vidět, spolehlivé výsledky neposkytuje žádný detektor. Nejlepší výsledky na základě mého malého vzorku vykazuje Copyleaks AI Detector, u ostatních dvou nástrojů je to spíše takové házení korunou. Zarážející je ale skutečnost, že nástroje u stejného textu poskytují zcela protichůdné odpovědi. Nejen z tohoto důvodu je zřejmé, že se na detektory nelze spoléhat, což může být problematické.

Vezmeme si třeba příklad personalisty, který třídí obdržené motivační dopisy uchazečů o zaměstnání na základě toho, zda jim s textem nepomáhala AI a ty, které detektor označí jako podezřelé, rovnou vyřazuje. Neprávem tak může uzavřít cestu k nové práci i poctivým uchazečům. A takových příkladů se najde více. Lidský cit pro pěkně napsaný text totiž zatím žádný detektor nenahradí.

Fakticky.cz

Online fakta

Test: Lze odhalit, že text generovala AI? Nástroje existují, ale výsledky jsou značně nespolehlivé

Jaké detektory jsem použil?

Text psaný člověkem

Text generovaný AI a následně upravený člověkem

Text čistě generovaný AI

Celkové hodnocení spolehlivosti AI detektorů

Štítky

Koboti na pracovišti: Revoluce ve výrobě, nebo nová rizika?

Hyperpersonalizace: Jak data a důvěra ovlivňují rozhodování spotřebitelů

Je stále Překladač Google dominantním překladačem, nebo by měl vyklidit pole AI?

Boj o TikTok v USA: Mezi zájemci jsou technologičtí giganti, Musk nabídku odmítl

TikToku hrozí v USA zákaz. Zásadní verdikt o budoucnosti aplikace vynese Nejvyšší soud

Zuckerberg podle soudu nenese odpovědnost v desítkách soudních sporů za poškozování dětí na sociálních sítích

Další čtení

Jak si poradit s poruchami HP tiskáren a kdy je čas vsadit na profesionální servis

Edge cloud computing – když každá milisekunda rozhoduje

DL formát v praxi – ideální volba pro pozvánky, oznámení i letáky

Komentář: Když se člověk ztratí sám v sobě aneb Zkoumání identity jako symptom blahobytu

Vědci vytvořili paměť počítače z běžné houby

Jaké detektory jsem použil?

Text psaný člověkem

Text generovaný AI a následně upravený člověkem

Text čistě generovaný AI

Celkové hodnocení spolehlivosti AI detektorů

Štítky

Mohlo by vás zajímat

Najděte vše, co potřebujete pro svou elektroniku na MediaOutlet.cz

Společnost vlastnící TikTok dokáže pomocí AI oživit kohokoliv z jedné fotky

Další čtení