Ovanför visas tre bilder med samma prompt. Groks bild är först och blev högre. Nästa är Geminis bild som blev fyrkantig. Copilots bilder blir ibland fyrkantiga men nu blev den avlång i liggande format.

Bilen ser lite olika ut på de olika AI versionerna. Den mest trovärdiga är nog på Geminis version.

Groks bild är mest trovärdig, även om ingen av bilderna är bra med tanke på prompten. Exempelvis står bilen stilla på alla bilderna, det vill säga hjulen snurrar inte. Här har Copilot försökt få till lite rörelse på hjulen genom att lägga till vatten som dras upp, men det fungerar inte då själva hjulet ser ut att stå stilla.

Detaljer som Lunds Domkyrka finns enbart med i Copilots version. Det verkar som om Copilot är bättre på att följa prompten, även om själva resultatet är blekare och mindre realistiskt än vad Grok och Gemini lyckas producera.

Här är prompten för bilden (och som synes klarade ingen av AI:erna detta så bra): "skapa en bild med en Porsche 911 Carrera som är ljusgul med texten Carrera på sidan av bilen nere vid dörrkanten. Bilen kör snabbt på en kullerstensväg i Lund, där det regnar något och solen skiner igenom regnet. I bakgrunden kan man se människor gå in och ut ur butiker, och förbi domkyrkan i Lund. Ett par står i förgrunden som tittar på när Porschen snabbt kör förbi."

Här är några fler bilder i föregående fantasistil, i samma ordning som de översta: Grok, Gemini och Copilot.

Skillnaderna är till synes inte så stora. Fortfarande är Groks bild högre än de övriga två. Grok ser ut att ha lite mer kontrast i färgerna, men det kan också bero på hur skuggor och ljus är renderade. Copilot är dock lite mjukare i färgerna igen och följer promptens innehåll bäst.

Provade med två bilder först (automatiskt två per prompt i Grok) och lade till figurer som Terminator och Spindelmannen, som faktiskt kom med. Blev lite förvånad. Grok gjorde det relativt bra, med lite märkliga detaljkombinationer.


Undertill har Gemini skapat bilderna, och även lyckats få med Terminator och Spindelmannen, någorlunda. Här är nog Gemini lite vassare gällande karaktärernas utseende.


Här är hela prompten: "skapa en bild med Terminator och Spindelmannen som samtalar i en sliten, stökig lägenhet på Manhattan. Persiennerna är neddragna med ljus som sipprar igenom dem. I bakgrunden kan även en kvinna med militär specialstyrke-kläder på sig, och en person som ser ut som en elektriker, som samtalar i en mobiltelefon."


Vill man ha det annorlunda kan man köra samma prompt några gånger extra, eller såklart skriva om den.

När det kommer till Copilot blev det stop.
Ställde en fråga: "vad är det du inte kan skapa".

Copilot svarade: "Jag kan inte skapa bilder som innehåller upphovsrättsskyddade karaktärer som Terminator eller Spindelmannen. De tillhör företag som har särskilda regler kring hur deras figurer får användas – i det här fallet Marvel/Disney och James Cameron/Paramount."

Detta är något som Gemini och Grok, undvek kanske genom algoritmer eller helt enkelt inte har dessa regler inskrivna på samma sätt som Copilot, som är en del av Microsoft, och kanske har mer ögon på sig.

Gjorde två bilder till med ovan nämnda promt. Man kan se att Groks bild har lägre upplösning och att Terminator mer ser ut som en blandning av skådespelaren Arnold och Terminator T-800.

På sätt och vis är den sistnämnda bilden mer korrekt, eftersom jag inte specificerade hur Terminatorn ska se ut, som robot eller som Arnold. Det är något man bör lägga till i den beskrivande texten.