Publié le 3 octobre 2025. Google rend son modèle d’IA de génération d’images, Gemini 2.5 Flash Image, officiellement disponible pour tous après une phase de test réussie. Désormais proposé avec une grande variété de formats, il promet une création de contenu flexible et une meilleure cohérence d’image.
- Le modèle d’IA générative d’images de Google, surnommé « Nano Banana », est désormais disponible en production.
- Il offre 10 ratios d’aspect différents, couvrant paysage, carré, portrait et des formats flexibles.
- Le modèle excelle dans la génération d’images cohérentes et dans la modification d’images existantes sur instruction en langage naturel.
Annoncé officiellement en août, le modèle Gemini 2.5 Flash Image, développé par Google, sort de sa phase bêta pour être accessible au grand public. Cette évolution majeure permet une intégration à grande échelle pour les développeurs et les entreprises via les API Gemini et Vertex AI. Sa tarification est fixée à 0,039 $ par image générée.
Ce qui distingue Gemini 2.5 Flash Image, c’est sa capacité remarquable à maintenir la cohérence d’un sujet à travers plusieurs images. Cela signifie qu’une marque peut, par exemple, générer des représentations du même produit dans divers contextes sans variation indésirable, ou qu’un utilisateur peut créer différentes tenues pour un personnage sans rencontrer les artefacts souvent observés avec d’autres outils d’IA générative, tels que des membres surnuméraires ou des distorsions anatomiques.
Outre la création d’images, le modèle excelle dans des tâches de modification subtile, répondant à des requêtes telles que « Enlève cette tache de sauce marinara de ma chemise, s’il te plaît ». Il est également capable de fusionner plusieurs images, démontrant ainsi une polyvalence technique appréciable.
Avant sa présentation officielle, ce modèle avait déjà circulé sous le nom de code « nano-banana » et avait suscité l’intérêt sur la plateforme Llama. Peu après son annonce publique fin août, Adobe avait révélé l’intégration de cette technologie dans ses propres outils, Firefly et Express.
L’industrie de l’IA générative d’images connaît une expansion rapide, de nombreux acteurs cherchant à proposer des alternatives plus économiques aux coûteuses séances photo traditionnelles. Cette semaine encore, OpenAI lançait Sora 2, une version améliorée de son générateur de vidéos Sora AI, marquant une avancée significative en matière de photoréalisme. Cette progression fulgurante dans la génération d’images ultra-réalistes s’accompagne inévitablement d’une prolifération de « deepfakes ».
Face à l’absence d’une réglementation fédérale complète, les entreprises technologiques assument la responsabilité d’intégrer des mécanismes de transparence dans leurs outils. L’objectif est de garantir que les utilisateurs soient conscients lorsqu’ils sont confrontés à du contenu généré par machine. Dans cette optique, toutes les images créées ou modifiées avec Gemini 2.5 Flash Image sont désormais dotées d’un filigrane invisible, un « SynthID ». Ce marquage permet d’identifier ces créations comme étant d’origine artificielle grâce à un modèle spécifique, bien qu’il ne soit pas perceptible à l’œil nu.