Kunstig intelligens-modeller som ChatGPT og Bard trænes ved hjælp af data skabt af mennesker. Jo flere data de indtager, jo klogere bliver de til at efterligne menneskelig intelligens og kreativitet. Store spillere i AI-industrien, som OpenAI og Meta, har implementeret store sprogmodeller, der er trænet ved at skrabe tekst og bøger, der er tilgængelige online, for at udtrække data.

På grund af, hvordan LLM'er trænes, var det uundgåeligt, at der ville være en konflikt mellem ophavsretslovgivningen og kunstig intelligens. Nu kommer kyllingerne hjem for at raste, da Sarah Silverman og andre kunstnere sagsøger OpenAI og Meta for krænkelse af ophavsretten.

I et gruppesøgsmål [PDF] indgivet i Californien, søger komiker Sarah Silverman og andre forfattere (Christopher Golden og Richard Kadrey) at få erstatning mod OpenAI og Meta for krænkelse af ophavsretten. Retssagen hævder, at OpenAI og Meta har skrabet ophavsretligt beskyttede bøger fra piratwebsteder for at træne deres AI-modeller. Dette svarer til en AI-model, der downloader sine træningsdatasæt fra Piratebay uden at kompensere forfatterne.

instagram viewer

Tilfældigvis, a separat gruppesøgsmål [PDF] mod OpenAI hævder, at virksomheden brugte uautoriseret privat information til at træne ChatGPT. Google står også over for en lignende retssag for angiveligt at bruge stjålne data til at træne Google Bard. Det er derfor, du bør gøre det til en vane at beskytte dine personlige oplysninger, selvom udgivelse af arbejde og private personlige data ikke er det samme.

Hvad er chancerne for, at Sarah Silverman kunne vinde retssagen?

Billedkredit: freepik

Silverman og andre kunstnere hævder, at ChatGPT nøjagtigt kan opsummere deres bøger, når de bliver bedt om det. Klagen hævder, at det ikke ville være muligt, hvis AI-modellen ikke havde adgang til det ophavsretligt beskyttede materiale. Men hvis ChatGPT blev trænet ved at bruge milliarder af internettekster, stødte det sandsynligvis på artikler, kommentarer og indlæg på sociale medier, der diskuterede bøgerne.

Desuden afslørede Meta, hvor det erhvervede de bøger, det brugte til at træne sin AI-model - kilden blev sporet til et e-bog torrent-websted. På samme måde nævner gruppesøgsmålet mod OpenAI også ulovlige websteder, hvor OpenAI er mistænkt for at have fået det ophavsretligt beskyttede materiale, men OpenAI mangler endnu at bekræfte sine kilder.

Hvis det er bevist, at OpenAI og Meta brugte ulovlige torrent-websteder til at erhverve ophavsretligt beskyttet materiale til at træne deres AI-modeller, kan Silverman have en chance for at vinde retssagen. Imidlertid er AI-modeller ukendt territorium uden præcedens for domstolene at stole på for at træffe en afgørelse baseret på AI-ophavsretskrænkelse. Det er faktisk en af ​​grundene til EU foreslog en AI-lov.

Hvad er fremtiden for AI-modeller og ophavsretslovgivning?

Vi er stadig i begyndelsen af ​​AI for at vide, hvordan den vil tilpasse sig ophavsretsloven. Det er endnu mere komplekst at prøve at finde ud af det der ejer ophavsretten til AI-skabelse. Men for menneskelige skabere findes der regler for at beskytte dem mod, at andre får adgang til deres ophavsretligt beskyttede materiale uden kompensation, samtykke eller kredit. Hvis reglerne eksisterer for mennesker, vil de så gælde for AI-modeller?

EU-parlamentet udarbejdede det nærmeste indblik i fremtiden af, hvordan AI-modeller vil overholde ophavsretsloven. Hvis EU's AI-lov vedtages i loven, vil AI-modeller som ChatGPT og Bard være forpligtet til at offentliggøre alle deres datasætkilder og ophavsretligt beskyttede data, der bruges til træning. Dette vil hjælpe med at opklare enhver forvirring, hvis AI-modellerne fik adgang til ophavsretligt beskyttede bøger, film, musik og fotos til træning gennem ulovlige piratkopieringswebsteder.

AI-afgørelsen om gruppesøgsmål vil danne en juridisk præcedens

Store sprogmodeller kan skrabe alle hjørner af internettet for data, der bruges til træning. Men ville de være ansvarlige for krænkelse af ophavsretten, hvis de tilgår ulovlige torrent-websteder for at erhverve dataene? Og hvis de gør, kan du så bevise det?

Uanset udfaldet vil gruppesøgsmålene mod de tech-virksomheder, der ejer de mest populære AI-modeller, skabe præcedens, der vil være relevant i fremtiden.