OpenAI a publié ChatGPT Images 2.0, une mise à jour de son modèle de génération d'images qui intègre des capacités de raisonnement. La nouvelle version permet au modèle de réfléchir de manière itérative aux invites, améliorant ainsi la précision des tâches telles que le rendu du texte dans les images et le suivi d'instructions complexes.
Selon OpenAI, Images 2.0 est basé sur l'architecture GPT-4o et peut générer des images avec un meilleur rendu du texte, un placement plus précis des objets et une meilleure adhésion aux invites des utilisateurs. Le modèle peut également affiner les images grâce à un processus de raisonnement en plusieurs étapes, similaire à la façon dont les modèles de texte de ChatGPT traitent les requêtes complexes.
La mise à jour est disponible pour les utilisateurs de ChatGPT Plus, Pro et Team, avec un accès entreprise à venir. OpenAI n'a pas précisé de date de sortie pour les utilisateurs de la version gratuite. L'entreprise a souligné que le modèle est conçu pour réduire les erreurs courantes telles que les mots mal orthographiés ou les objets déformés.
Cette version fait suite aux capacités de génération d'images d'OpenAI introduites en 2024. L'entreprise n'a pas divulgué de mesures de performance spécifiques ni de comparaisons avec les versions précédentes.