ChatGPT, Bing AI og Google Bard er nogle af de mest genkendelige navne i verden af kunstig forbrugerintelligens. Alle tre produkter har én ting til fælles - de er alle generative AI-produkter.
Men hvad er egentlig generativ AI, og hvad har udløst den nylige fascination af dette genopståede AI-rum?
Hvad er Generativ AI?
Generativ AI, forkortelse for "generativ kunstig intelligens", er en type AI-system, der kan generere unikt eller originalt indhold som tekst, lyd, videoer eller billeder efter behov. I modsætning til nogle traditionelle AI-systemer designet til opgaver som dataklassificering eller analyse, generativ AI modeller er mere optaget af at producere nye eller kreative output baseret på de instruktioner, de er givet.
Selvom generativ kunstig intelligens kan virke som en ny teknologi, har den faktisk eksisteret i årtier. Adskillige iterationer og former har eksisteret mindst så tidligt som i 1960'erne. Kunstig intelligens er et stort felt, og generativ kunstig intelligens er kun en undersektion.
Et af de mest fascinerende aspekter ved at bruge en generativt AI-værktøj som ChatGPT eller Googles Bard AI er disse værktøjers evne til at generere indhold, der matcher din anmodning. Du beder ChatGPT om at skrive et digt i stil med William Shakespeare, og du får noget, der påfaldende ligner Shakespeares værk. Du beder den om at lave en tale i stil med Donald Trump, og du ville få noget, der på imponerende vis efterligner tonen fra den tidligere amerikanske præsident. Så hvordan er det muligt? Hvordan er generativ kunstig intelligens i stand til at udføre en så fascinerende bedrift?
Sådan fungerer generativ AI
Arbejdsmekanismen i en generativ AI-model involverer et komplekst samspil mellem forskellige dyb-læringsteknikker og algoritmer. De nøjagtige detaljer om, hvordan en generativ model fungerer, afhænger af dens mål og den underliggende arkitektur. For eksempel vil en generativ model til generering af lyduddrag have en anden arbejdsmekanisme end en, der er beregnet til at generere videoer eller tekst.
Men i deres kerne fungerer de fleste, hvis ikke alle, generative modeller på samme måde på deres grundlæggende niveau. De lærer af en stor mængde data, fanger mønstre og stile af dataene og bruger derefter disse fangede mønstre til at reproducere prøver svarende til det, de har lært i deres træningsdata.
Du kan tænke på generative AI-værktøjer som musikkomponist. Forestil dig, at denne musikkomponist har lyttet til utallige sange og studeret harmonier, melodier, rytmer og strukturer i en række musikgenrer. Denne komponist har med andre ord et omfattende kendskab til de musikalske genrer. Med denne viden kan komponisten skabe original eller unik musik inspireret af det, de har lært.
Så hvis de har lært meget om popmusik, kan du bede dem om at komponere en popsang, og det vil de ikke have problemer med at gøre. Den komponerede musik ville så være et udtryk for komponistens forståelse af, hvordan popmusik skal se ud baseret på det, de har lært. På samme måde er produktet af generativ AI et udtryk for AI-modellens forståelse af de underliggende begreber, der er lært fra dens træningsdata.
Så hvis du vil skabe en generativ AI-model, der genererer billeder af biler, skal du fodre modellen med et enormt datasæt af bilbilleder. For at skabe en imponerende model, skal du give den billeder af så mange bilmærker og modeller, som du kan komme i tanke om. Med tilstrækkelig træning vil algoritmen lære, hvordan hvert bilmærke eller model ser ud, og vi vil være i stand til at skabe billeder af næsten enhver bil, du kan tænke på, efter behov.
Populære Generative AI-modeller
Der er hundredvis af generative AI-modeller i øjeblikket under udvikling eller allerede ved at blive implementeret på forbruger-AI-markedet. Nogle af de populære, du bør kende til inkluderer:
1. Generative Pre-Trained Transformer (GPT)
GPT, udviklet af OpenAI, er blandt de mest genkendelige navne i det generative AI-rum. Dens popularitet afhænger af dens effektivitet som en konversations-AI-model og den virale succes af ChatGPT-chatbot, som bruger GPT som sin underliggende teknologi. Det er en stor sprogmodel designet til at generere menneskelignende tekst, når du bliver bedt om det. Typisk for enhver generativ AI-model, alle iterationer af GPT-modellen er blevet trænet i en enorm mængde forskellige tekstdata.
2. Pathways Language Model (PaLM)
PaLM, en eksperimentel storsprogsmodel fra Google, er en kraftfuld generativ AI-model, der er i stand til at udføre et stort område af opgaver som kreativ skrivning, kodegenerering, sprogoversættelse og en række andre tekstbaserede naturlige sprog opgaver. Ligesom GPT blev PaLM trænet på et stort korpus af tekstdata hentet fra en bred vifte af kilder på tværs af nettet. det er AI-modellen, der driver Googles Bard AI.
3. Musiksprogmodel (MusicLM)
MusicLM er en anden generativ AI-model fra Google. Det er designet til at generere "high-fidelity" musik fra simple tekstprompter. Trænet på tusindvis af timers musik på tværs af forskellige genrer, kan den generative model skabe unik musik ved at bruge enkle beskrivelser af den musik, du har brug for som input. Hvis du undrer dig over, hvor god den er, så er den her vores anmeldelse af MusicLM-modellen.
4. DALL-E
DALL-E er OpenAI's AI-billedgenereringsmodel designet til at skabe flere stilarter af unikke billeder fra tekstprompter. Det er en multimodal implementering af GPT-modellen, trænet på adskillige tekst-billede-par fra forskellige kilder på tværs af internettet.
Ud over generative AI-modeller finder du også generative AI-produkter som Midjourney, DALL-E-billedgenerator, Stabil diffusionsbilledgenerator, Hugging Chat og flere andre imponerende AI-produkter drevet af generativ AI modeller.
Hvorfor er generativ AI eksploderet i popularitet?
Den 30. november 2022 annoncerede OpenAI CEO Sam Altman lanceringen af ChatGPT i et tweet. På trods af at han var OpenAI's administrerende direktør, var Altman relativt ukendt i det større internetsamfund, og hans tweet kom med lidt eller ingen fanfare.
Fem dage senere havde ChatGPT samlet sine første en million brugere; det gjorde det med en hastighed, som ingen app har hørt. Det samlede flere millioner mere til sidst gør ChatGPT til den hurtigst voksende app nogensinde. Selvom ChatGPT ikke er det første generative AI-produkt, bragte dets ankomst på AI-produktscenen generativ AI ind i offentlig bevidsthed mere end noget andet teknologisk produkt før det.
Selvom ChatGPT har været spidsen af spydet i at drive hypen omkring generativ AI, gjorde det det ikke alene. 2022 vil blive husket som året, hvor generative AI-værktøjer blev mainstream. Fra samtale-AI-chatbots til kode- og kunstgeneratorer var anden halvdel af 2022 første gang, at flere AI-værktøjer, der havde både masseappel og praktiske daglige anvendelser, kom på markedet. Med disse værktøjer kom populariteten af dens underliggende teknologi – generativ AI.
Generative AI-værktøjer såsom Bing AI, Google's Bard, DALL-E, ChatGPT og Midjourney har problemfrit vævet sig ind i stoffet i vores daglige liv og konstant præsenterer os for deres bemærkelsesværdige kreationer. Uanset om det er de fængslende opskrifter lavet af ChatGPT eller de forbløffende naturtro billeder fremtryllet af Midjourney er generativ kunstig intelligens blevet en altid tilstedeværende følgesvend, der ledsager os dag ind og dag ud. Dette er tilblivelsen af den nylige popularitet af generativ AI.
Omfavn Generativ AI
Populariteten af generative AI-værktøjer er ikke et modefænomen. I modsætning til nogle nyere teknologiske tendenser, der vandt popularitet og forsvandt med tiden, er generativ AI en teknologi, der har faktiske praktiske fordele. Da denne genopblussende teknologiniche smyger sig ind i næsten alle aspekter af vores digitale liv, er det bedst at finde måder, hvorpå man kan udnytte teknologien bedst muligt i stedet for at undre sig over det.