OpenAI rullar ut DALL-E 3 i ChatGPT – finns snart för alla Plus-användare

Nu gör OpenAI det mycket enklare att generera bilder med sin tredje version av DALL-E som nu integreras direkt i ChatGPT.

DALL-E 3 erbjuder överlägsen kvalitet jämfört med DALL-E 2. Och med ett enkelt kommando kommer du kunna generera dina bilder direkt i ditt konversationsfönster som Plus-användare av ChatGPT.

DALL-E 3, har visat sig vara en stor förbättring jämfört med dess föregångare, särskilt när det gäller att skapa bilder med högre komplexitet och detaljrikedom. Det är nu även möjlighet att komplettera sin prompt med mer information såsom:

  • Specifika kameramodeller och linser
  • Skärpedjup och andra inställningar
  • Format på bilder
  • Detaljerade instruktioner (färger, former, kläder eller ansiktsuttryck)

OpenAI rullar ut det här i steg och alla Plus-användare har ännu inte fått tillgång. Det går dock även att generera bilder gratis i Bing Image Creator som nu använder en version av DALL-E 3.

Vad innebär Dall-E 3 för marknadsförare?

För marknadsförare betyder detta enkel åtkomst via ChatGPT för att generera bilder av hög kvalitet direkt i webbläsaren. Och för alla som inte gillar att generera bilder med Midjourney i Discord så är det stort.

Förutom kvaliteten och möjligheten att generera bilder direkt i ChatGPT så finns det tre andra stora nyheter:

1) ChatGPT hjälper dig med att utveckla dina prompts till skillnad från tidigare DALL-E 2 eller Midjourney. Men det går också att be ChatGPT att inte förändra grund-prompten.

2) Chatta och utveckla bilder. Precis som du kan göra med text så kan du fortsätta en konversation med ChatGPT och utveckla och förfina utan att behöva börja om.

3) Möjligheten att generera bilder som innehåller text på ett relativt bra sätt. Även om det inte är perfekt alla gånger. Detta har tidigare varit omöjligt med andra modeller.

Trots sina styrkor har DALL-E 3 fortfarande vissa begränsningar. Till exempel har den svårigheter med att korrekt generera bilder av flera människor, särskilt närbilder. Här blir det ofta fel i bilden, både ansikten som inte stämmer och händer som ser lite galna ut.

Modellen har även fler restriktioner än vad till exempel Midjourney har. Försöker du generera någonting som strider mot deras policy och guidelines så får du direkt varningar och felmeddelanden.

Några exempel som du inte kan generera är följande:

  • Bilder av publika figurer
  • Bilder på specifika produkter t.ex iPhone
  • Bilder som strider mot mänskliga rättigheter
  • Övrigt som kan strida mot copyright

Min analys och rekommendation

DALL-E 3:s integration i ChatGPT visar hur kraftfull AI kan vara när den kombineras med rätt verktyg och prompts.

Modellen har tagit ett stort kliv och erbjuder nu samma eller till och med bättre resultat än Midjourney. Speciellt för de som inte är riktigt nördiga inom prompt engineering för bildgenerering.

Midjourney har fortfarande vissa fördelar då den inte styrs av en stor språkmodell som påverkar din prompt vilket DALL-E 3 gör i ChatGPT. Detta gäller för dig som verkligen vill skapa komplexa prompts utan extern påverkan.

Så min rekommendation blir nu att utforska möjligheterna och begränsningarna med modellen och förstå hur du bäst promptar Dall-E 3.

Länkar och rekommenderad läsning:

Sibbe Silvén

Om författaren: Sibbe Silvén

Sibbe Silvén här, jag är en AI nörd, har djupdykt i AI sedan 2011 och nu föreläser och utbildar jag inom ämnet, samtidigt som jag är delägare och grundare av marknadsföringsbyrån Bright Mind Agency som vann Greatest TikTok i Norden 2022.

Share
Share
Tweet