Publié le 2025-11-05 13:44:00. Microsoft lance son nouveau modèle de génération d’images, MAI-Image-1, qui se positionne déjà en tête des classements de création numérique. Bien que temporairement indisponible dans l’Union européenne, il promet d’offrir une alternative performante aux modèles existants.
- MAI-Image-1, le dernier né de Microsoft en matière de génération d’images, s’est rapidement hissé au sommet du classement LMArena, surpassant d’autres outils de création numérique.
- Actuellement intégré exclusivement à Bing Image Creator et non à Copilot, ce modèle n’est pas encore accessible aux utilisateurs de l’Union européenne, mais une arrivée prochaine est annoncée.
- Microsoft met en avant la capacité de MAI-Image-1 à produire des images photoréalistes, avec une attention particulière portée à la gestion de l’éclairage, des paysages et à la précision des détails, notamment pour la représentation humaine.
La nouvelle technologie de génération d’images de Microsoft, baptisée MAI-Image-1, a fait une entrée remarquée dans le paysage numérique. Dès sa présentation, elle s’est imposée en tête du classement LMArena, une plateforme comparant les performances des meilleurs outils de création d’images à partir de texte. Microsoft a formé ce modèle dans le but d’apporter une « réelle valeur aux créateurs », en veillant à éviter les résultats génériques ou répétitifs. L’accent a été mis sur une sélection rigoureuse des données et une évaluation axée sur les usages créatifs concrets.
Actuellement, MAI-Image-1 est proposé via l’outil Bing Image Creator, aux côtés de deux autres modèles : Dall-E 3 et son successeur GPT-Image-1, tous deux développés par OpenAI. Ces derniers, bien que capables de générer des images rapidement, sont souvent critiqués pour leur manque de réalisme ou leur style graphique reconnaissable, parfois comparé à celui des jeux vidéo. MAI-Image-1, en revanche, se distingue par sa tendance naturelle à produire des rendus plus réalistes, même face à des requêtes originales. Microsoft souligne que le modèle excelle particulièrement dans la génération d’images photoréalistes, notamment pour les scènes d’intérieur, les paysages, et même les représentations humaines, domaine où les intelligences artificielles peinent souvent à respecter des détails cruciaux comme le nombre de doigts.
« Nous avons formé ce modèle pour apporter une réelle valeur aux créateurs et avons pris grand soin d’éviter les sorties répétitives ou stylisées de manière générique. Par exemple, nous avons donné la priorité à une sélection minutieuse des données et à une évaluation nuancée axée sur des tâches qui correspondent étroitement à une utilisation créative réelle. MAI-Image-1 excelle dans la génération d’images photoréalistes telles que l’éclairage (par exemple lumière réfléchie, reflets), les paysages et bien plus encore. Cela est particulièrement vrai par rapport à de nombreux modèles plus grands et plus lents. »
Microsoft
L’outil est désormais disponible pour des formats d’image 1:1, 3:2 et 2:3, avec une résolution générée d’un mégapixel. Si Microsoft affirme que MAI excelle dans la représentation de la nourriture ou de la nature, les retours d’utilisateurs saluent également la qualité des portraits générés, notamment la fidélité des couleurs et des textures de peau, ainsi que la précision anatomique des mains. Des exemples comparatifs réalisés avec des prompts en tchèque, incluant une scène humoristique d’un chat chevauchant un chien et la description détaillée d’un portrait féminin, illustrent la capacité du modèle à interpréter des demandes complexes avec réalisme. Ces réalisations, ainsi que d’autres exemples, sont consultables sur le réseau social X.
Bien que MAI-Image-1 ne soit pas encore proposé aux résidents de l’Union européenne, Microsoft a promis une disponibilité prochaine. Pour les plus impatients, l’utilisation d’un VPN permettrait, selon des tests effectués, d’accéder dès à présent à l’outil.