
Efter bråkat med Copilot läste jag om Gemini (Google) och provade ungefär samma saker med Camaro z28 1970 års modell som blivit en slags benchmark/testgrund för AI i mitt fall.
Fantastiskt resultat och bilmodellen är korrekt i det mesta. Jag ville ha en sk split bumper på fronten och där blev det stopp. Den t o m uttryckligen svarade att algoritmerna hade svårt att få fram detta även om det var en välkänd detalj i den årsmodellen. Började med att skriva om promten för att "lura" AIn. Gick ibland men oftast inte.
Promten följs någorlunda men resultatet blir ibland helt olika oavsett det är samma promt som används. Samma som Copilot.
Det som direkt skiljer sig åt är att Gemini är mycket mer realistiskt, och resultatet är riktigt bra om man är ute efter fotorealism och korrekt utformning av saker, så långt som jag provat. Copilot följer vissa saker mer direkt men resultaten är inte så realistiska alltid. Scenarion blir mer som bearbetade bilder till ett spel eller något liknande. Gemini skapar bilder som kunde använts i mer seriösa sammanhang.
Exempel på fel som kom fram genom Gemini, var bl a att den skapade en groda i vissa bilder som togs fram. Förstod inte vad den menade med det så jag frågade. Gemini svarade med att jag ville ha bilen i grodperspektiv. Så jag fick tala om att vinkeln var bra med att ta bort grodan.
Här är en slutgiltig version med delad stötfångare, svart bil med arg kanin och träskmark, med ett blinkande ufo i bakgrunden. Även att bilen kör på en sliten asfaltväg etc. Tyvärr så tog den med två extra insug mitt på motorhuven. De är extra socker på kakan antar jag.
Bildkvaliten är bra, och den skriver ut all text jag lagt in i promten, t o m på däcksidorna, vilket Copilot inte lyckades med alls.
Här bild på hur den klarar av text.
Här en bild som Copilot skapat med samma promt som i bilden högtst upp skapad av Gemini. Lite skillnad.
