Kan autentisk kunst virkelig beskyttes mod AI? Kreative synes mere og mere magtesløse.
Generative AI-værktøjer som Midjourney og Stable Diffusion producerer stadig mere overbevisende billeder. Alligevel er de afhængige af enorme databaser med kreative arbejder for at generere deres indhold. På dette tidspunkt spekulerer du måske på, om der er en måde at beskytte dit arbejde mod AI-værktøjer, og svaret er: det er kompliceret.
Generative AI-værktøjer bruger maskinlæringsmodeller, der er trænet til at udføre handlinger ved hjælp af store datasæt. Lad os sige, at vi taler om en AI-billedgenerator som Midjourney. I dette tilfælde omfatter de datasæt, der bruges til træning, milliarder af billed- og tekstpar – fra værker af legendariske kunstnere som Picasso til både professionelle og amatørkreative.
AI-kunstgeneratorer bruger disse medie-tekst-parringer til at generere visuelt indhold som svar på brugertekstprompter. Grundlæggende bruger de eksisterende kunstneres arbejde og matcher mønstre med tekstparringer (sociale indlæg, billedtekster, alt-tekst osv.), så brugerne kan generere nye visuals fra prompter som "en stjerneklar nattehimmel i stil med Vincent van Gogh" eller "en neo-noir scene af en detektiv, der drikker whisky i 1950'ernes Downtown LA”.
Hvorfor er så mange kunstnere sure?
Den største klage fra kreative er, at generative AI-værktøjer bruger deres arbejde uden tilladelse. De bruger heller ikke blot deres arbejde til at træne algoritmer.
Marketingsnakken om generativ AI antyder, at disse værktøjer skaber unikt indhold, men det gør de ikke. Det, de virkelig gør, er at kombinere data fra flere kunstværker og splejse det sammen for at generere noget, der matcher brugerens prompt.
Selve udtrykket AI-generering er vildledende. AI-replikering ville være mere nøjagtig, og tricket med disse værktøjer er, at de replikerer store mængder illustrationer og blander dem sammen.
Generative AI-værktøjer er designet til at erstatte annoncemateriale – og de gør det ved at bruge deres illustrationer. Og som om det ikke er slemt nok, gør de fleste AI-værktøjer alt dette uden at spørge om tilladelse, tilbyde nogen form for kompensation eller endda kreditere de originale skabere.
Desværre er den eneste måde at forhindre AI-værktøjer i at få adgang til noget af dit indhold på at udgive intet online. Det lyder måske ekstremt, men sådan er virkeligheden. Selvfølgelig kan du bruge robots.txt-filen på dit websted til blokere AI-værktøjer fra at skrabe dit websted, eller beskytte dine billeder mod AI ved at fravælge træningsdatasæt, men disse metoder har flere begrænsninger.
For det første er kommandoer i robots.txt-filen rådgivende, hvilket betyder, at websteder ikke er juridisk forpligtet til at overholde. For det andet skulle du blokere en virksomhed som Google fra at crawle din hjemmeside, hvilket dybest set er SEO-selvmord. Og til sidst giver robots.txt-filen dig kun (begrænset) kontrol over adgangen til dit websted, den beskytter ikke det indhold, du udgiver andre steder: sociale medier, cloud-tjenester og så videre.
Desværre for kreative vil landskabet blive værre, før det bliver bedre.
Googles privatlivspolitik kan betyde, at den bruger alt onlineindhold til at træne sine AI-algoritmer
I juli 2023 opdaterede Google sin privatlivspolitik for at sige, at det vil bruge onlineindhold til at træne sine AI-systemer, herunder Brad, Google Translate og andre. Google bruger udtrykket "offentligt tilgængelige kilder". Her er citatet, der rejste nogle alarmklokker efter opdateringen:
"For eksempel kan vi indsamle oplysninger, der er offentligt tilgængelige online eller fra andre offentlige kilder for at hjælpe træne Googles AI-modeller og byg produkter og funktioner, såsom Google Translate, Bard og Cloud AI-funktioner." – Googles privatlivspolitik
Med andre ord siger Google nu, at alt, hvad du udgiver online, er på højkant. I det mindste gør Google det nemt at sammenligne opdateringer til sin privatlivspolitik ved at fremhæve de seneste ændringer:
Som du kan se, er ændringerne i ordlyden ret subtile, men implikationerne er betydelige. Tidligere var de primære funktioner i Googles sprogmodeller at fortolke søgeforespørgsler og oversætte tekst til andre sprog.
Nu siger firmaet, at det kan bruge alle offentligt tilgængelige kilder til at træne hele sin pakke af AI-modeller. Dette inkluderer dets generative AI-system, Bard, og udvider sig ud over sprogmodeller til at omfatte alle Googles AI-værktøjer/-funktioner – det mest oplagte eksempel er billedgenerering.
Sociale netværk kan bruge ethvert indhold, du udgiver på deres platforme
Meta har også uhindret adgang til alt udgivet på Facebook, Instagram og Threads. Dette er standardpraksis for sociale platforme, hvis du læser T&C'erne. Så snart du uploader noget til et socialt netværk, har de rettighederne til at bruge og genbruge det på enhver måde, de ønsker.
Mange af sociale brugere har fundet virksomheder, der bruger deres billeder i annoncer uden tilladelse, herunder annoncemateriale. Desværre, hvis det firma tilfældigvis er det sociale netværk, du uploadede billedet til, netværkets moderselskab eller et andet mærke, der ejes af det samme moderselskab, er du uheldig.
For de fleste mennesker er chancerne for, at en platform som Instagram bruger et af deres billeder til en annoncekampagne, meget lav. Men Meta bruger næsten helt sikkert dine billeder, videoer og indlæg til at træne sine AI-algoritmer.
Tjenester som Adobe kan få adgang til og bruge dit arbejde til at træne deres algoritmer
I januar 2023 fik Adobe lidt varme til en opdatering af sine T&C'er. Sproget så ud til at antyde, at Adobe kunne bruge billeder, der blev uploadet til deres cloud-tjenester af fotografer til at træne sine AI-algoritmer.
Den specifikke formulering var som følger:
"Adobe analyserer muligvis dit indhold ved hjælp af teknikker såsom maskinlæring (f.eks. til mønstergenkendelse) for at udvikle og forbedre vores produkter og tjenester."
For at gøre tingene værre tilvalgte Adobe automatisk brugere til dette indholdsanalysesystem, hvilket betyder, at de manuelt skulle slukke for det i deres kontoindstillinger. Forståeligt nok reagerede kreative ikke alt for venligt, og Adobe pustede til ilden ved ikke i første omgang at reagere på kritik.
Uger senere udtalte Adobe, at ingen kundedata bliver brugt til at træne dets generative AI-værktøjer. Virksomheden kaldte hændelsen et wake-up call og lovede at rydde op i enhver forvirring ved at gøre formuleringen af sin politik mere specifik.
Uanset hvad er det faktum, at hvis Adobe ønsker at bruge kundedata til at træne sine AI-systemer, der er ikke noget nogen kan gøre ved det - andet end boykot. Samtidig henter Adobe sine data til værktøjer som Generative Fill fra et sted, så det bruger kunstneres arbejde på den ene eller anden måde.
Teknologivirksomheder har næsten ubegrænset adgang til dine data... for nu
Som tingene ser ud, har teknologigiganter som Google og Meta næsten ubegrænset adgang til annoncemateriales data. Granskning af deres håndtering af brugerdata er næsten lige så gammel som internettet, men reglerne om beskyttelse af privatlivets fred spiller stadig ind.
Det tog EU indtil 2018 at implementere det GDPR retningslinjer for beskyttelse af personlige oplysninger og de har gjort lidt for at beskytte brugerdata.
Generativ AI er et helt nyt minefelt med næsten ingen regler på plads for at begrænse teknologivirksomheders handlinger i dette rum. Indtil videre kan virksomheder som Google og OpenAI gøre næsten alt, hvad de vil med vores data, og det kommer ikke til at ændre sig i den nærmeste fremtid.
I sidste ende vil det kræve retssager og regler for at beskytte kunstnere mod kunstig intelligens
Indtil generativ AI og dens adgang til brugerdata er reguleret, er kreative næsten magtesløse til at stoppe teknologien. Det mest sandsynlige scenarie ville være ændringer af love om ophavsret eller potentielt nye databeskyttelser relateret til kreativt ejerskab. I begge tilfælde vil det tage lang tid at se nye regler introduceret og derefter håndhævet.
Fordelen for kreative er, at retssagerne mod generativ AI hober sig op hurtigt, og det kan fremskynde den juridiske reaktion. Den dårlige nyhed er, at nogle af de involverede teknologivirksomheder har de juridiske midler til at trække disse sager gennem de mest tidskrævende veje til retfærdig proces.
I mellemtiden vil de etiske spørgsmål, der hænger over AI-kunstgenerering, blive hængende.