OpenAI hat neuen Bild-Generator gestartet
26. März 2025 um 07:29:25
Michael Förtsch
Am Dienstagabend hat OpenAI überraschend einen neuen Bild-Generator veröffentlicht, der nun sowohl in ChatGPT als auch in der OpenAI-Video-Plattform Sora verfügbar ist. Das Text-zu-Bild-Tool, das derzeit unter dem Namen Images in ChatGPT läuft, arbeitet mit dem omnimodalen KI-Modell GPT-4o, das über eine integrierte Bildgenerierungsfunktion verfügt, die nun freigeschalten wurde.

Im Gegensatz zu Stable Diffusion, Midjourney oder Flux werden Bilder nicht aus einem digitalen Rauschen erzeugt, sondern autoregressiv aus kleinen Pixelblöcken von links nach rechts und von oben nach unten zusammengesetzt. Aufgrund des Sprach- und Kontextverständnisses von GPT-4o ist es möglich, Bilder mit langen Texten und komplexen Szenenkompositionen zu erzeugen. Ebenso ist es möglich, die erzeugten Bilder im Dialog mit ChatGPT/Sora zu verändern.
Laut OpenAI kann Images in ChatGPT Bilder mit bis zu 20 beschriebenen Objekten in der Regel fehlerfrei handhaben. Tatsächlich konnte der Bildgenerator in unseren Tests sowohl sehr komplexe, phantasievolle als auch sehr fotorealistische Bilder erzeugen.