ChatGPT Images 2.0 intègre le raisonnement dans la génération d'images

ChatGPT Images 2.0 d'OpenAI introduit des capacités de raisonnement pour la génération d'images, permettant un raffinement itératif et le rendu de texte.

ChatGPT Images 2.0 Adds Reasoning to Image Generation

Image: gsmarena.com

OpenAI a publié ChatGPT Images 2.0, une mise à jour de son modèle de génération d'images qui intègre des capacités de raisonnement. La nouvelle version permet au modèle de réfléchir de manière itérative aux invites, améliorant ainsi la précision des tâches telles que le rendu du texte dans les images et le suivi d'instructions complexes.

Selon OpenAI, Images 2.0 est basé sur l'architecture GPT-4o et peut générer des images avec un meilleur rendu du texte, un placement plus précis des objets et une meilleure adhésion aux invites des utilisateurs. Le modèle peut également affiner les images grâce à un processus de raisonnement en plusieurs étapes, similaire à la façon dont les modèles de texte de ChatGPT traitent les requêtes complexes.

La mise à jour est disponible pour les utilisateurs de ChatGPT Plus, Pro et Team, avec un accès entreprise à venir. OpenAI n'a pas précisé de date de sortie pour les utilisateurs de la version gratuite. L'entreprise a souligné que le modèle est conçu pour réduire les erreurs courantes telles que les mots mal orthographiés ou les objets déformés.

Cette version fait suite aux capacités de génération d'images d'OpenAI introduites en 2024. L'entreprise n'a pas divulgué de mesures de performance spécifiques ni de comparaisons avec les versions précédentes.

❓ Frequently Asked Questions

What is new in ChatGPT Images 2.0?

It adds reasoning capabilities, allowing the model to iteratively refine images and better follow complex prompts, including improved text rendering.

Who can access ChatGPT Images 2.0?

It is available to ChatGPT Plus, Pro, and Team users. Enterprise access is planned, but no date has been announced for free-tier users.

What architecture does Images 2.0 use?

It is built on OpenAI's GPT-4o architecture, which enables multi-step reasoning for image generation.

📰 Source:
gsmarena.com →
Partager: