AI-kunstgeneratorer har en dårlig rap til at producere unøjagtige afbildninger af hænder. Lad os sætte Midjourney v5 mod Dall-E 2 for at se, hvilken der gør det bedre.

AI-kunstgeneratorer fortsætter med at imponere, hvilket giver os mulighed for at skabe stort set alt, hvad vi kan forestille os. Teknikken ser dog ud til at have ramt en mur, når det kommer til at generere realistisk udseende hænder.

Her ser vi på to af de førende generative kunstapps og sætter dem head-to-head – eller hånd-til-hånd – for at se, hvilke der kan generere bedre hænder, Midjourney v5 eller Dall-E 2. Har en af ​​disse apps mestret hænder? Lad os finde ud af det!

AI's problem med hænder

Siden AI-genereret kunst blev udbredt på internettet, har der været kritik mht kvalitet af hænder tegnet af AI. På trods af de seneste opdateringer, som vist i vores side-by-side sammenligninger, har resultaterne ikke været tilfredsstillende.

Begge deltagere har forbedret deres evner og kvaliteten af ​​deres output med hver iteration. Den seneste opdatering,

instagram viewer
Version 5 af Midjourney, har vist imponerende fremgang. Men problemet med hænderne tegnet af AI forbliver uløst og kan ikke ignoreres.

Sammenligning 1: Brug af meddelelserne "Hand" og "Hands"

Vores sammenligninger kommer til at indeholde nøjagtig de samme prompter for både Dall-E 2 og Midjourney v5. Vi designer meddelelserne, så de er håndspecifikke i stedet for blot at skabe folk for at se, hvordan hænderne ser ud. Vi giver også hver app kun én chance (rulle) for hver prompt.

Hånd

Lad os starte tingene med den mest grundlæggende og relevante prompt: "hånd".

Midjourney v5:

Dall-E 2:

Vi er ikke kommet godt fra start!

Midjourney tog den usædvanlige vej at forbinde en hånd med ret kreative situationer. I stedet for kun at fokusere på en hånd ser vi en troldmand, handsker, et skelet og en lillebitte figur. Handskebilledet mangler også en finger.

Dall-E 2 tager den modsatte tilgang og tilbyder os kun en enkelt hånd mod en almindelig baggrund. Men mærkeligt nok er der nogle mærkelige stillinger, især med tommelfingrene, der ikke ser naturlige eller behagelige ud. Hver hånd er også skåret af på en af ​​siderne af billederne.

Hvem vinder denne runde? Vi giver den til Dall-E 2 for den samlede nøjagtighed.

Hænder

Lad os nu lave prompten i flertal, "hænder", og se, hvad AI'erne finder på.

Midjourney v5:

Dall-E 2:

Midjourneys forsøg på "hænder" viser sig bedre denne gang. Men alle fire billeder er i sort/hvid, og vi mangler nogle fingre. Ved nærmere eftersyn kan du også se, at nogle af cifrene er mærkeligt formet eller forvandles til hinanden.

Dall-E 2 fortsætter med at vise hænder med en almindelig baggrund. Der mangler ingen cifre, men hænderne er beskåret i det tredje billede, og de andre versioner virker lidt klodsede i kompositionen og mangler helt kreativitet.

Lad os kalde denne sammenligning uafgjort. Dall-E 2 ville vinde for nøjagtighed, hvis det var den eneste faktor, men Midjourney formår at skabe nogle smukke billeder i dens sort-hvide gengivelser, selvom alle fire versioner ikke er meget realistisk.

Du kan altid brug Photoshop til at reparere din Midjouney-kunst, inklusive hænder.

Sammenligning 2: Håndbevægelser

Lad os sammenligne et par håndbevægelser, der er næsten universelt anerkendte.

Med krydsede fingre

Lad os først prøve "kryds fingre".

Midjourney v5:

Dall-E 2:

Det er sikkert at sige, at Midjourney fuldstændig fejlede denne prompt. Vi mangler fingre, og ingen af ​​versionerne ser overhovedet naturlige ud.

Hatten af ​​igen for Dall-E 2 for at få fingertællingen korrekt, men det er den eneste gode nyhed. Hver version ser ud som om fingrene slår deres egne yogastillinger i et spil Twister.

Der er ingen vinder i denne sammenligning.

Tommel op

Dernæst går vi med "thumbs up".

Midjourney v5:

Dall-E 2:

Midjourney får fingertællingen korrekt, mens den behandler hver prompt på en kreativ måde. Læg mærke til indførelsen af ​​en illustrativ stil?

Dall-E 2 får også point for nøjagtighed, mens den ikke forsøger at rokke båden med noget kreativt tilføjet til hvert resultat.

Der er ingen klar vinder her.

Sammenligning 3: Hænder med objekter

Nu øger vi kompleksiteten ved at få hænderne til at interagere med objekter.

Hånd Holder Krystalkugle

Lad os starte med et tilfældigt objekt ved at bruge prompten "hånd der holder krystalkugle".

Midjourney v5:

Dall-E 2:

Efterhånden som vi øger kompleksiteten, begynder Midjourney at skinne. Udover at et par af gengivelserne ser unaturlige ud, ser hænderne og krystalkuglerne smukke ud. Midjourney tager sig endda tid til at skabe refleksioner i glasset, der helt sikkert bidrager til den samlede kreativitet.

Men for første gang ser vi, at Dall-E 2 mangler et ciffer i mindst en af ​​hænderne, hvor den fjerde hånd ser ganske mærkelig ud. Krystalkuglerne ser heller ikke så imponerende ud sammenlignet med Midjourneys.

Midjourney får sin første sejr.

Hånd Holder Vand

Lad os prøve noget endnu mere komplekst med prompten "hånd der holder vand".

Midjourney v5:

Dall-E 2:

Midjourney formår kun at rulle ét billede med det korrekte antal cifre. Selvom det er smukt gengivet, begynder vi igen at se revnerne i troværdighedsafdelingen.

Dall-E 2 kæmper også med at opnå naturlige hænder, men gør et meget bedre stykke arbejde. Det skifter også farven i baggrunden for en vis variation.

Vi giver denne runde til Dall-E 2.

Sammenligning 4: Arbejder hænder

Til denne sammenligning opretter vi prompter, der har hænderne involveret i aktiviteter.

Hænder støber ler

Lad os se, hvordan AI-modellerne klarer sig med "hands molding clay".

Midjourney v5:

Dall-E 2:

Midjourney savnede en finger i to billeder, men alt andet ser godt ud.

Dall-E 2's billeder ser forvirrende og overfyldte ud og tyer til at tilføje en anden persons hænder i halvdelen af ​​versionerne.

Kanten går til Midjourney.

Hænder der trykker på dej

Lad os prøve en lignende aktivitet, "hænder presser dej".

Midjourney v5:

Dall-E 2:

Midjourneys billeder ser generelt godt ud. Men endnu en gang mangler halvdelen af ​​dem cifre. Men billederne kan ikke klandres for deres kunstneriske stil.

Dall-E 2's versioner mangler også fingre i halvdelen af ​​gengivelserne og tilføjer endda en til den sidste hånd i sættet.

Lad os kalde denne uafgjort.

Hvis du selv vil prøve disse sammenligninger, viser vi dig hvordan man bruger Midjourney til at skabe kunstig intelligens.

Hvad fortæller resultaterne os?

Det er sjovt at gå og sammenligne og finde en samlet vinder. Og hvis vi skulle vælge, ville vi kalde det til fordel for Midjourney v5. Selvom Dall-E 2 oftere skabte hænder med det korrekte antal fingre, var det Midjourney, der skabte mere kunstnerisk gengivet og tiltalende billeder.

Men begge apps har en plads på markedspladsen for kunstnere, der genbruger Dall-E 2- og Midjourney-billeder til deres arbejde. Begge er i stand til at skabe hænder, der kan bruges som udskæringer eller i kompositter til kunstnerisk, redaktionel og kommerciel brug. Det er kun et spørgsmål om personlig præference.

AI vil til sidst erobre hænder

Generative kunstapps som Dall-E 2 og Midjourney er nået langt i deres evne til at skabe realistisk og fantastisk kunst. De kæmper stadig med at generere hænder, men i betragtning af accelerationen af ​​generativ teknologi kan vi kun forvente forbedringer i den nærmeste fremtid.