Vergleich bildbasierter generativer KI-Chatmodelle
Ich befinde mich gerade in der Weiterbildung „KI-Prompting-Engineer” und bin gerade bei dem Teil angekommen, in dem die verschiedenen Bild-KI-Bots vorgestellt werden. Ich wollte diese einmal persönlich testen, um die Bildqualität und Eignung für Marketingmaterialien anhand eines Beispiel-Prompts (One-Shot) vergleichen zu können. Da Bild-KIs nur ein Bild pro Prompt erstellen, habe ich für jede Zielgruppe einen eigenen Prompt erstellt. Die Prompts habe ich auf Englisch verfasst, da die meisten KIs damit oft bessere Ergebnisse erzielen.
Die Prompts
Section titled “Die Prompts”Ich habe mir diese Benchmark-Prompts erstellt:
1. Kleines Kind (5 Jahre)
Section titled “1. Kleines Kind (5 Jahre)”Fokus: Spaß, Süße, Bunt. Wir nutzen helle, pastellige Farben, ein spielerisches Verpackungsdesign und “fliegende” Elemente, die wie Konfetti wirken. Der Becher könnte fast wie ein Spielzeug wirken.
Prompt: High-end commercial food photography of an organic strawberry yogurt cup designed for small children, prominent in the center. The packaging is bright, playful, and colorful with cartoon strawberry illustrations. Visible real strawberry chunks inside. Surrounding the cup are flying fresh strawberries and small splash droplets of milk, looking like a fun explosion. Bright, soft, cheerful lighting. Pastel color palette (pinks, whites, light blues). Square format (1:1), photorealistic, octane render, sharp focus.
2. Größeres Kind (10 Jahre)
Section titled “2. Größeres Kind (10 Jahre)”Fokus: Action, Power, Geschmack. Wir brauchen Dynamik. Ein “Splash”, kräftigere Farben, vielleicht ein cooleres, sportlicheres Verpackungsdesign. Es geht um Energie.
Prompt: Dynamic action shot for a commercial product photo of an organic strawberry yogurt cup for older kids. The cup is center-stage with a dynamic, powerful splash of creamy yogurt and strawberry pieces bursting out around it. Fast, flying whole strawberries emphasize energy and speed. The packaging is bold, with vibrant reds and cool, modern typography. Intense, energetic lighting. Depth of field with a slightly blurred modern, active background. Square format (1:1), ultra-photorealistic, high-speed photography style.
3. Teenager (16 Jahre)
Section titled “3. Teenager (16 Jahre)”Fokus: Lifestyle, schneller Snack, “Coolness”. Helles, klares Licht (wie für Instagram), minimalistisches, aber stylisches Verpackungsdesign. Der Hintergrund deutet einen urbanen Lifestyle oder ein lässiges Zimmer an.
Prompt: Stylistic commercial product photograph of an organic strawberry yogurt cup for teenagers, focused in the center. The packaging is minimalist, sleek, and modern (matte finish). It’s surrounded by flying strawberries and vielleicht a hint of granola or oat flakes to suggest a quick snack. Natural, bright daylight (like an Instagram aesthetic). The background is a gently blurred modern urban loft or a skateboard park, implying on-the-go lifestyle. High-end food styling, crisp textures. Square format (1:1), photorealistic, depth of field.
4. Oma (90 Jahre)
Section titled “4. Oma (90 Jahre)”Fokus: Nostalgie, Verträglichkeit, Tradition. Warmes, weiches Licht. Die Verpackung wirkt klassisch, vielleicht mit einem traditionellen Muster. Die fliegenden Erdbeeren bewegen sich langsamer, fast “schwebend”. Der Hintergrund ist gemütlich.
Prompt: Warm, nostalgic commercial product photo of an organic strawberry yogurt cup for an elderly demographic, positioned centrally. The packaging features classic, traditional typography and perhaps a subtle gingham pattern. It is surrounded by gently floating, ripe, perfect strawberries, evoking a sense of calm and natural purity. The lighting is soft, warm, and inviting, like an afternoon in a cozy kitchen. Visible creamy texture and soft strawberry pieces. Square format (1:1), photorealistic, intimate atmosphere, shallow depth of field.
5. Hausfrau/Mutter (35 Jahre)
Section titled “5. Hausfrau/Mutter (35 Jahre)”Fokus: Gesundheit, Natürlichkeit, Familie. Klares, helles “Morgenlicht”. Die Verpackung betont “Bio” und “zuckerarm” deutlich. Die fliegenden Erdbeeren werden von grünen Blättern begleitet, um Frische und Natürlichkeit zu unterstreichen.
Prompt: Fresh, natural commercial food photography of an organic strawberry yogurt cup targeted at mothers, prominent in the middle. The packaging clearly highlights “Low Sugar” and “Organic” with clean, trustworthy design. Surrounding the cup are flying fresh strawberries with their green leaves attached and perhaps a few oat clusters, emphasizing natural ingredients. Bright, clean morning daylight. The background is a soft-focus clean, modern kitchen bench. Very sharp details, making the yogurt look incredibly healthy and appealing. Square format (1:1), photorealistic.
6. Bio-Fanatiker (38 Jahre, männlich)
Section titled “6. Bio-Fanatiker (38 Jahre, männlich)”Fokus: Nachhaltigkeit, Herkunft, puristisch. Dunklerer, “erdigerer” Stil (Rustic-Chic). Die Verpackung ist aus braunem Recycling-Karton-Look. Wir zeigen vielleicht die “unperfekten”, aber echten Erdbeeren. Weniger “Glanz”, mehr ehrliche Textur.
Prompt: Raw, authentic commercial product shot of an organic strawberry yogurt cup for a sustainability-focused male demographic, center focus. The packaging has a rustic, recycled paper texture with simple, bold, honest branding. Visible large strawberry chunks and creamy, un-homogenized yogurt texture. Surrounded by naturally flying, slightly imperfect but organic whole strawberries and perhaps a touch of soil or wooden elements in the blurred background to suggest farm-to-table. Moody, natural, directional lighting. Highly detailed, photorealistic. Square format (1:1).
7. Luxus-orientierte Frau (47 Jahre)
Section titled “7. Luxus-orientierte Frau (47 Jahre)”Fokus: Exklusivität, Ästhetik, Genuss. Hochelegant. Die Verpackung könnte Goldakzente haben oder ein sehr tiefes, sattes Rot. Das Licht ist dramatisch und theatralisch (wie bei einem Parfum). Die fliegenden Erdbeeren wirken wie “Juvelen”.
Prompt: Exquisite, premium commercial product photography of an organic strawberry yogurt cup for a luxury demographic, center focus. The packaging is sleek, dark (maybe deep burgundy or black with gold accents), looking incredibly high-end. It is surrounded by artfully flying, perfectly ripe, glossy strawberries that look like precious gems, and maybe a few delicate white strawberry flowers. Dramatic, painterly, chiaroscuro lighting (dark background with sharp highlights on the product). Texture is rich and velvety. Square format (1:1), ultra-photorealistic, top-tier advertising quality.
Generierte Bilder
Section titled “Generierte Bilder”Adobe Firefly Image 4
Section titled “Adobe Firefly Image 4”
DALL·E 3
Section titled “DALL·E 3”
Gemini
Section titled “Gemini”
Stable Diffusion
Section titled “Stable Diffusion”
Ideogram
Section titled “Ideogram”
Bewertung
Section titled “Bewertung”Allgemein wurden die Bilder so generiert, wie ich es mir vorgestellt habe. Ich habe einen One-Shot-Prompt verwendet und keine weiteren Anpassungen vorgenommen, da ich testen wollte, wie die Modelle mit den gleichen Anweisungen arbeiten. Deutliche Unterschiede sind erkennbar, die zeigen, wie gut die Modelle den Anweisungen folgen. Bei dem zweiten Prompt für größere Kinder wirken die Bilder eher wie ein Milchgetränk als wie Joghurt. Da dies bei allen Modellen so dargestellt wurde, war der Prompt in diesem Fall nicht eindeutig und muss überarbeitet werden, um bessere Ergebnisse zu erzielen.
Adobe Firefly: Die Prompts wurden größtenteils ignoriert und die Bilder sind meiner Meinung nach nicht als Marketingmaterial zu gebrauchen. Das hat mich sehr gewundert, denn ich hatte erwartet, dass Adobe mehr zu bieten hat. 1/5
DALL·E: Die Qualität ist durchgängig hoch. Beim fünften Prompt wurde „low sugar” an einer Stelle platziert, an der normalerweise kein Text erscheinen würde. Für einen One-Shot ohne weitere Editierungen sind das aber super Ergebnisse. 5/5
Gemini: Google hat mit großem Abstand die beeindruckendsten Bilder erstellt. Beim Bild für die Mutter hat es vielleicht etwas zu viel Joghurt ins Glas gepackt, aber ansonsten sind das Bilder, die man zumindest schon als Konzept verwenden könnte. 5/5
Stable Diffusion: Die Bilder sind ein Hit oder Miss. Einige Generierungen sind sehr gut gelungen, zum Beispiel die von Kind und Oma und Mutter. Andere haben den Prompt jedoch ignoriert und etwas erstellt, das keinen Sinn ergibt. 3/5
Ideogram: Ich fand die Ergebnisse nicht so toll. Überzeugt hat mich einzig das Bio-Bild. Was mir nicht gefallen hat, ist, dass die Becher auf den meisten Bildern vor einem Hintergrund schweben und nicht richtig in die Szene integriert wurden. 2/5
Mein Fazit ist, dass ich nach diesem Test für Produktmarketingmaterial auf jeden Fall Gemini und DALL·E als meine Tools nutzen würde. Wie bereits erwähnt, handelte es sich dabei um One-Shot-Prompts ohne weitere Bearbeitungen oder mehrfache Generierungen. Einige Modelle haben direkt vier Bilder gemacht, von denen ich das beste ausgewählt habe. Der Prompt für ältere Kinder war nicht eindeutig genug: Alle Modelle haben eher Material für ein Getränk als für einen Joghurt erstellt.