Efter lanceringen af ChatGPT i november 2022 er den fænomenale AI-chatbot dukket op som et af de mest betroede skriveværktøjer på internettet. Det er nemt at bruge; beskriv, hvad du skal have skrevet, og ChatGPT udskriver det på skærmen på få sekunder.
Men i en æra, hvor AI-genereret tekst videregives som menneskeskreven og bruges til at opnå en uretfærdig fordel, er det meget vigtigt at identificere AI-indhold. Men ChatGPT kan ikke præcist spotte AI-indhold, heller ikke dets eget arbejde - men hvorfor?
Er der en forskel mellem AI-tekst og menneskelig skrivning?
En forudsætning for, at ChatGPT kan få øje på sin egen skrift eller enhver AI-genereret tekst, er, at der skal være forskel på den og menneskeskreven tekst. Så er der nogen væsentlig forskel mellem menneskeskrevet tekst og AI-genereret indhold? Hvis der er, burde et værktøj som ChatGPT være i stand til at skelne det.
Vi skrev en novelle uden input fra noget AI-værktøj og spurgte derefter ChatGPT, om historien var AI-skrevet indhold. ChatGPT markerede det trygt som en AI-genereret tekst.
Vi bad derefter ChatGPT om at generere en historie, og i den samme chattråd kopierede vi den genererede tekst og spurgte ChatGPT, om teksten var AI-skabt. ChatGPTs svar? Et selvsikkert "Nej."
ChatGPT mislykkedes i at identificere menneskeskreven eller AI-genereret tekst i begge tilfælde. Så hvorfor kan ChatGPT ikke finde sin egen tekst? Betyder det, at der ikke er nogen forskel mellem AI og menneskelig tekst?
Det er der. Vi kunne skrive en hel bog om forskellen mellem de to, men det betyder ikke meget. Så hvis der er en forskel, hvorfor er ChatGPT eller noget andet AI-værktøj ude af stand til at identificere disse forskelle og præcist påpege AI-genereret tekst fra en menneskeskrevet tekst? Svaret ligger i hvordan ChatGPT fungerer, og hvordan det genererer tekst.
Hvordan ChatGPT genererer tekst
Når du beder ChatGPT om at generere tekst, forsøger den at efterligne den menneskelige skriveproces. For det første er modellen bag ChatGPT - Generative Pre-trained Transformer (GPT) - blevet trænet på et stort korpus af menneskelig tekst. Alt fra e-mails, sundhedsartikler, tekniske artikler, high school essays og næsten enhver tekst, du kan finde online, er blevet tilført modellen under træningen. Så ChatGPT forstår, hvordan hver af disse typer tekster skal skrives.
Hvis du beder ChatGPT om at skrive en e-mail til din chef, ved den, hvordan en e-mail af den art skal se ud, fordi den er blevet trænet i lignende e-mails - formentlig tusindvis af dem. På samme måde, hvis du beder den om at skrive et gymnasieopgave, ved den også, hvordan et gymnasieopgave skal lyde. ChatGPT vil forsøge at skrive, hvad du vil have den til at skrive på en måde, som et menneske ville.
Men der er en hage. I modsætning til hvordan mennesker skriver, forstår ChatGPT ikke rigtig, hvad det skriver på en måde, som et menneske ville. I stedet forsøger chatbotten at forudsige, hvad der ville være det mest plausible næste ord i en sætning, indtil det fuldender opskrivningen.
Hvordan ChatGPT skriver efter forudsigelse
Lad os sige, at du beder ChatGPT om at skrive en historie om en fiktiv by kaldet Volkra. Der er en enorm mulighed for, at chatbotten starter historien med ordene "Once upon". Dette er fordi chatbotten ikke tænker for sig selv, men forsøger at forudsige, hvad et menneske ville skrive baseret på, hvad det har lært fra de tusindvis af historier, det er blevet fodret med i løbet af uddannelse.
Så ved at tro, at et menneske sandsynligvis ville starte historien med ordene "Once upon", ville ChatGPT derefter forsøge at forudsige det næste logiske ord, som ville være "a" efterfulgt af "tid". Så du ville så have "Der var engang..." efterfulgt af det næste logiske ord og det næste indtil historien er færdig. ChatGPT skriver dybest set ved at forudsige, hvilket ord naturligt (eller i det mindste har størst sandsynlighed) for at komme næste i en sætning og indsætte det.
Så når et AI-værktøj forsøger at opdage, om en tekst er AI-genereret, er et af kriterierne, det forsøger at veje, tekstens forudsigelighed, da AI-værktøjer skriver ved forudsigelse. Dette mål for forudsigelighed kaldes forvirring i AI-sprog. Når nu præsenteret for en tekst, blandt andre kriterier, forsøger et AI-værktøj som ChatGPT at analysere teksten for at måle, hvor forudsigelig rækkefølgen af ord eller sætninger i teksten er. Større forudsigelighed eller lav forvirring betyder typisk, at teksten sandsynligvis er AI-genereret. Mindre forudsigelighed eller højere forvirring betyder typisk, at teksten sandsynligvis er skrevet af mennesker.
Disse kriterier, sammen med andre faktorer, såsom niveauet af kreativitet i en tekst, er desværre ikke nok til at fastslå med sikkerhed, om en tekst er skrevet af et AI-værktøj eller ej. Dette skyldes, at mennesker kan skrive med større varians, som i eksempelteksten, vi brugte til demonstration i begyndelsen af denne artikel.
AI-chatbots som ChatGPT er designet til at efterligne naturligt menneskeligt sprog så meget som muligt. Så selvom AI-tekst kan have mærkbare mønstre, er disse mønstre ikke så tydelige, selv for et kraftfuldt værktøj som ChatGPT. Dette er grunden til, at ChatGPT ikke kan få øje på sin egen skrivning, samt hvorfor AI-tekstdetektorværktøjer ikke virker.
Vil ChatGPT genkende sin egen skrift i fremtiden?
I øjeblikket kan værktøjer som ChatGPT ikke registrere, om en tekst er skrevet af sig selv eller noget andet AI-værktøj, fordi der ikke er noget klart, mærkbart mønster i AI-genereret indhold. Der er dog en god chance for, at dette snart kan ændre sig. Med bestræbelser fra virksomheder som ChatGPT for at introducere digitale vandmærker i ChatGPT-genereret indhold, vil der være et mere mærkbart mønster til teksten, der genereres af chatbotten.