GPT-4o generiert jetzt Bilder mit lesbarem Text

In einem gestrigen Videostrean hat OpenAI bekannt gegeben, dass GPT-4o jetzt die Erstellung hochwertiger KI-generierter Bilder, welche insbesondere durch überzeugend gerenderten, gut lesbaren Text hervorstechen.

Bisher waren Texte in KI-Bildern oft fehlerhaft oder unleserlich, doch GPT-4o verbessert dies deutlich und erlaubt sogar realistische Darstellungen von Logos und Schriftzügen. Die Funktion basiert auf einem kombinierten Training mit Bildern und Texten, was zu konsistenten, kontextgerechten Resultaten führt. Anwender können Bilder durch natürliche Konversationen generieren, vorhandene Bilder verändern und Charaktere für Videospiele gestalten, deren Aussehen kontextuell angepasst wird. GPT-4o verwaltet dabei bis zu 20 verschiedene Objekte. Diese innovative Bilderzeugung ist aktuell für Nutzer von ChatGPT Plus, Pro, Team und auch für Nutzer der kostenlosen Version verfügbar, weitere Zielgruppen wie Enterprise und Edu sollen folgen.