Efter ett antal försök med olika typer av bilder ser jag nu vad Copilot har lite svårare för. Men fordon, till exempel, hanterar den betydligt bättre än vad Adobe Firefly gör. Däremot är Firefly något bättre på att skapa naturtrogna bilder med människor. Det ska dock tilläggas att om man ställer för många krav i prompten – med många detaljer – kan Firefly ofta tappa tråden, särskilt i ansikten, som ibland kan bli märkliga. Men för enklare prompts, som till exempel ”en kvinna med långt hår som talar i en mobiltelefon”, fungerar det troligtvis bra – även om det kanske inte blir helt naturligt. Den har antagligen bättre referenser att utgå från i sådana fall. Däremot fungerar produkter, bilar och liknande inte särskilt bra i Firefly.

Här är ett exempel på ett försök jag gjorde, där jag började med många små prompts som till slut byggdes ihop till en lång – som även den justerades i flera omgångar. Bilden nedanför är resultatet av det sista försöket med den slutgiltiga prompten. Men trots det blir resultatet olika varje gång. Så även om du har en prompt som tydligt beskriver vad du vill ha, krävs det ofta flera försök och ibland efterredigering för att få till det du är ute efter. Det sker ju trots allt på Copilots villkor. Å andra sidan tar det längre tid att skapa en bild helt från grunden – och alla misslyckade försök kan faktiskt ge upphov till nya idéer längs vägen. En detalj, som hjulens storlek, förändrades helt plötsligt bara för att jag ändrade något i bakgrunden i prompten – då blev hjulen betydligt större. Det var kanske inte helt önskat. Jag försökte justera ner dem igen, men om man låter dem vara överdimensionerade får bilden en mer fantasylik känsla, nästan som om hjulen hör hemma på ett stridsfordon. Det var dock inte tanken från början – fokus låg främst på bilens design. Tyvärr tenderar bilderna att bli något ihoptryckta på grund av Copilots begränsningar, vilket gör att man ofta måste justera helheten även av den anledningen.

Plötsligt började även avlånga stenar, nästan som obelisker, dyka upp i bakgrunden bland blixtarna. Markeringar på marken tillkom också efter att jag lagt in glöd och symboler i prompten. Vapnet som kvinnan håller hittade Copilot själv på, men det fungerar faktiskt ganska bra – den verkar ha tagit någon referens och utvecklat utifrån det. Vapen är annars något som både Copilot och många andra AI-bildgeneratorer har svårt med eller inte godkänner alls. Det krävs ofta lite kreativt tänkande – ibland räcker det med en liten felstavning eller en otydlig formulering i prompten för att det inte ska gå igenom.

Ett galleri med vampyrbilder från utveckligens gång. Några på själva bilen i miljö med bild på sidan. Sedan mer fokus på slott och sedan vidare med några karaktärer, och mer detaljer.

Asfalten jag hade med från början blev gradvis mer lik kullersten ju mer jag promptade, så jag var tvungen att återintroducera just asfalt i prompten med jämna mellanrum för att den skulle finnas kvar i slutbilden.

Intressant nog förändrades även kvinnan på bilden efter ytterligare justeringar – hon blev plötsligt en man eller en könsneutral figur med kvinnliga attribut. Vid ett tillfälle dök dessutom en extra måne upp, trots att det inte alls var något jag inkluderat i prompten.

Men det är just sådana oväntade saker som gör att det både kan vara roligt och frustrerande att skapa bilder med AI.

I galleriet kan ni se hur processen ungefär har sett ut – från att enbart skapa själva bilen med en vampyrkänsla, till att bygga upp en hel scen.

Värt att nämna är att bilen är en Chevrolet från 1976, vilket är viktigt eftersom Copilot är mycket bra på att återskapa sådana detaljer. Det blev också ett bra sätt för mig att förbättra min egen kunskap om årsmodeller. Jag insåg nämligen att bilen inte såg ut som jag ville från början, så jag ändrade bilens årsmodell i prompten – och plötsligt såg den ut exakt som jag hade tänkt mig.

Modellen jag använde först var en Chevrolet från 1970, men efter lite efterforskning kom jag fram till att det egentligen var en modell från 1976 jag ville ha.

Intressant är också att Copilot, trots att jag använder exakt samma prompt flera gånger i rad, kan välja att göra bilden antingen kvadratisk eller rektangulär (stående eller liggande format), och ibland även spegelvänd.

Jag väljer att se det som något spännande – en hjälp på traven i det kreativa arbetet – eftersom jag ändå gör om många detaljer senare i till exempel Photoshop.

En bild till med en något uppdaterad promt. Nu när bilden redan har en form som fungerar kan man jobba vidare på den, med nya promter,

Här en bild med samma promt som ovan med Gemini. Skulle nog säga att Copilot är bättre på den här typen av bilder, än Gemini som producerar rakt på bara utan att det blir rätt känsla. Smaksak förstås.