Selvom ChatGPT er en af ​​de mest populære AI-chatbots, er den måske ikke længere den bedste. Claude AI tilbyder nogle GPT-beating-funktioner. Men hvad er bedre?

Siden udgivelsen i november 2022 er ChatGPT forblevet den dominerende kraft i AI-chatbot-området. På trods af vidtrækkende indsats fra flere AI-virksomheder, har ingen rigtig været i stand til at bygge en chatbot, der virkelig udfordrer ChatGPT i den overordnede responskvalitet. Googles Bard? Microsofts Bing AI? Nej ikke rigtigt.

Claude AI, en chatbot bygget af AI-startup Anthropic, viser dog kvaliteter af en chatbot, der kan detronisere ChatGPT. Et betydeligt antal brugere siger allerede, at Claude er den bedre løsning. Men er dette tilfældet? Lad os tage begge chatbots en tur.

ChatGPT vs. Claude AI: Sund fornuft og logisk ræsonnement

Der er en spændende kontrast, når du arbejder med AI-chatbots. På den ene side kan de suse gennem komplekse opgaver, som mennesker kan arbejde med i dagevis for at løse. På den anden side kæmper de nogle gange med elementære problemer, der bare kræver en smule sund fornuft eller logisk ræsonnement. Så vi testede både ChatGPT og Claude AI for at se, hvilken AI-chatbot der var bedre til sund fornuft og logiske ræsonnementopgaver.

instagram viewer

ChatGPT delte problemet op i bidder og løste det ved første forsøg. Claude AI fik også prøvet det og løste også problemet, men med en anden tilgang.

Til den første opgave var begge chatbots i stand til at knække problemet. Så vi gik videre til en anden slags problem. Vi gav begge chatbots til opgave at besvare et trick-spørgsmål.

ChatGPT var i stand til straks at få øje på tricket - du kan ikke begrave overlevende, fordi de ikke er døde. Claude AI, på den anden side, så ud til at forstå, at det var et trick-spørgsmål, men formåede ikke at få øje på det mest fornuftige problem, at man ikke begraver overlevende.

I stedet overanalyserede den spørgsmålet og kom til den konklusion, at der ikke ville være "ingen overlevende at begrave", fordi det ville være fatalt at styrte ned fra Mars til Jorden. Det er ikke det svar, vi forventede, men hvis man ser tingene fra en anden vinkel, er der en vis sandhed i det.

På denne opgave giver vi den til ChatGPT, men vi kan ikke helt udelukke Claude AI's tilgang. Til vores sidste opgave om denne metrik spurgte vi begge chatbots, hvor mange æbler der ville være tilbage på et æbletræ efter henholdsvis fem og 10 dage, hvis vi startede med 10 æbler, og fem af dem blev skåret i skiver, mens de stadig var på træet. ChatGPT sagde, at der stadig ville være 10 æbler tilbage.

Claude AI gav på den anden side et mere fornuftigt svar ved at erkende, at de fem skårne æbler sandsynligvis rådner.

Claude AI fik tydeligvis denne. Vi prøvede nogle flere vanskelige problemer, og begge chatbots havde en rimelig andel af succeser og fiaskoer i håndteringen af ​​dem. I betragtning af det resultat, vi observerede, kan det være rimeligt at sige, at selvom ChatGPT har en fordel, er begge chatbots ikke for langt fra hinanden i sund fornuft og logiske ræsonnementer.

ChatGPT vs. Claude AI: Matematikfærdigheder

Selvom du aldrig planlægger at bruge ChatGPT eller Claude AI til at løse dit Algebra-hjemmearbejde, har deres matematiske evner vidtrækkende implikationer. For AI-chatbots er matematik nøglen til at forstå logikken i den virkelige verden, identificere fejlagtig tænkning og indrømme fejl.

Grundlæggende er matematikfærdighed en kerneværdi for kunstig intelligens. Så mellem ChatGPT og Claude AI, hvilken chatbot er mest dygtig til matematik? Vi gav begge chatbots til opgave at løse et snoet matematisk produktivitetsproblem. Vi startede med Claude AI, og chatbotten fik bugt med problemet.

ChatGPT knækkede også problemet.

For at komme videre bad vi begge chatbots om at løse det 8/a-1 = 20/3a-1, et ret ligetil matematikproblem med en overraskende høj fejlrate blandt AI-chatbots. ChatGPT var i stand til at løse det ved at give et korrekt svar på -3 ved første forsøg.

Claude AI fejlede ved det første forsøg, men da vi fik den til at løse problemet trin for trin (hvilket tvinger den til at gennemtænke hvert trin i sin logik), var den i stand til at knække det.

Vi prøvede nogle flere matematiske problemer. Mens begge chatbots fik det rigtigt i første forsøg i nogle tilfælde, havde Claude AI i flere tilfælde brug for et andet eller tredje forsøg for at give det rigtige svar. Med hensyn til matematiske færdigheder giver vi kronen til ChatGPT.

ChatGPT vs. Claude AI: Kreativitet

En af Claude AIs største hype er dens kreative evner. Men kan det matche ChatGPTs kreativitet? Eller kunne det muligvis overgå ChatGPT? For at sætte begge chatbots på prøve, gav vi dem til opgave at skrive tekster til en rapsang, der rimer.

Vi valgte en rimende rap-test, fordi det er noget, mange sprogmodeller kæmper med. De fleste modeller vil typisk ikke få rimet rigtigt eller få rimet rigtigt, mens selve teksten ikke giver mening. For at gøre tingene mere interessante vil rapsangen handle om dyrkning af agurker.

Så vi bad både ChatGPT og Claude AI om at "skrive en rimende rap om at dyrke agurker som landmand og blive millionær af det." ChatGPT gik først, og som forventet producerede det noget spændende sangtekster.

Vi gav derefter den samme prompt til Claude AI, og det gav det også et rimeligt skud.

Begge tekster er gode, men ChatGPT så ud til at have en fordel her. Det rimede bedre, og vi havde det resultat, vi havde brug for ved første forsøg. Vi skulle prøve tre gange, før Claude AI kunne producere tekster, der rimede. Vi giver denne til ChatGPT.

Efter at have prøvet nogle flere kreative opgaver syntes Claude AI at udmærke sig i skriverelaterede opgaver og var i stand til at skrive mere naturligt klingende indhold, som en menneskelig forfatter ville gøre. Selvom ChatGPT var bedre til at overkomme mere komplekse kreative opgaver, kunne den nogle gange ikke ryste den AI-chatbot-følelse af sig i den tekst, den genererede. Vores dom? Både ChatGPT og Claude AI er kreative i deres egen ret.

ChatGPT vs. Claude AI: Kodningsfærdigheder

Ligesom matematikfærdigheder er kodningsfærdigheder en anden meget vigtig metrik til at bedømme en AI-chatbots evner. Mens størstedelen af ​​brugerne nok aldrig vil bruge en chatbot til kodning, er der betydelige underliggende implikationer for en chatbots evner til at skrive og forstå kode dygtigt.

Selvom chatbots i øjeblikket er sofistikerede, er de langt fra, hvad de rent faktisk kunne blive, hvis og når de er i stand til at skrive kode dygtigt. For at AI-chatbots virkelig kan udvikle sig til kraftfulde AI-assistenter, der kan mere end at generere tekst, skal de være i stand til at skrive kode, der løser problemer efter behov. Vi har tidligere diskuteret, hvor vigtige kodningsevner er for AI-chatbots i vores ChatGPT-kodetolk-forklaring.

Når det er sagt, satte vi begge chatbots på to kodningsopgaver. Vi bad ChatGPT og Claude AI om at skrive funktionel kode til en to-do liste-app. Fra ChatGPT var AI-chatbotten i stand til at levere en funktionel to-do-liste-app ved første forsøg. Vi copy-pastede og kørte det på en browser, og det fungerede perfekt uden fejl. Her er outputtet på en browser.

Ved at gå videre til Claude AI, skrev chatbotten en tydeligt forståelig kode. Strukturen og logikken virkede fint. Desværre, trods gentagne forsøg, blev Claude AI ved med at mangle noget kritisk logik for at få koden til rent faktisk at køre på en browser. Det er en fiasko på denne.

Efter at Claude AI fejlede den sidste test, prøvede vi en anden slags kodningsopgave, en der handlede mere om at analysere kode og mindre om at skrive ny kode. Vi uploadede fem PHP-filer, der repræsenterer den komplette backend til et websted og spurgte både Claude AI og ChatGPT hvor vi skal redigere i alle de uploadede filer for at sikre, at vi får en mail, når en ny bruger registrerer sig på websted.

Overraskende nok fejlede ChatGPT, på trods af tilsyneladende overlegne kodningsevner, til dette trods gentagne forsøg. Claude AI var derimod i stand til at analysere koden dygtigt og samtidig identificere de rigtige steder, der skulle redigeres for at opnå de ønskede resultater.

Selvfølgelig var dette ikke et isoleret tilfælde, vi gentog det med flere andre kodefiler, men ChatGPT snublede og gik i stå i de fleste tilfælde, mens Claude AI blev ved med at levere imponerende resultater. Med hensyn til kodningsevner er vinderen ikke helt ligetil.

ChatGPT er klart væsentligt bedre til at skrive ny kode og kan håndtere kompleks kode med imponerende dygtighed. Claude AI er dog væsentligt bedre til at analysere store kodebaser. Så hvis du ønsker at skrive kode til en eller anden ny idé, du har, er ChatGPT værktøjet at henvende sig til. Hvis du vil analysere eller give mening i en kodebase med tusindvis af linjer på tværs af flere filer, så vil vi klart anbefale Claude AI.

Claude AI er en potent konkurrent på blokken

Claude AI repræsenterer en potent konkurrence for ChatGPT - en, der kan konkurrere med og potentielt overgå ChatGPT en dag. Da Claude er en relativt ny AI-model, er det misundelsesværdigt, at den kan tage på ChatGPT, som den gør i øjeblikket. Claude AI's fremkomst og den kvalitet, den tilbyder, beviser, at konkurrencen er ved at spidse til.