Publié le 2024-05-15 10:00:00. Face à l’ascension de Sora 2 d’OpenAI, Google riposte dans la course aux générateurs vidéo avec une version améliorée de son modèle, Veo 3.1. L’entreprise met l’accent sur la précision physique, l’intégration de dialogues et l’ajout d’ambiances sonores, tout en intégrant ces avancées dans son écosystème créatif.
- Veo 3.1 améliore la génération de vidéos avec plus de réalisme physique et une meilleure gestion des dialogues et ambiances sonores.
- Google intègre ces avancées dans son outil créatif Flow, offrant plus de contrôle aux utilisateurs sur leurs créations.
- Bien que prometteur, Veo 3.1 peine encore à égaler les performances physiques de Sora 2 selon les premiers retours.
La compétition dans le domaine de la génération vidéo par intelligence artificielle s’intensifie. Alors qu’OpenAI continue de faire parler de son modèle Sora 2, notamment avec la création d’un réseau social dédié au partage de créations IA, Google dévoile une mise à jour de son propre outil : Veo 3.1. Cette nouvelle version promet des progrès notables, particulièrement dans la restitution de la physique des mouvements, la qualité des dialogues générés, ainsi que dans la création de musiques d’ambiance et de sons immersifs.
L’approche de Google se distingue par son intégration poussée au sein de son écosystème. L’outil Flow devient ainsi une plateforme centrale pour les créateurs. Il permet de concevoir des vidéos en partant d’images clés, de fusionner divers éléments comme l’environnement, les personnages et leurs costumes, ou encore de diriger le style visuel d’une scène grâce à une image de référence. Les vidéos générées ont une durée de base de 8 secondes en résolution 720p, mais la possibilité d’ajouter des séquences supplémentaires assure une fluidité narrative accrue.
Cependant, les premiers retours d’utilisateurs ayant eu l’occasion de tester Veo 3.1 se montrent partagés. Si une amélioration par rapport à la version précédente (Veo 3) est constatée, notamment sur le plan physique, elle n’atteint pas encore le niveau de Sora 2. Google semble d’ailleurs mettre davantage l’accent sur les nouvelles fonctionnalités apportées à Flow plutôt que sur une révolution dans la génération vidéo elle-même.
Flow s’adresse principalement aux créatifs, leur offrant un contrôle affiné sur les scènes générées. L’accès à Veo 3.1 est conditionné par le niveau d’abonnement. Les abonnés Gemini Pro bénéficient de 1000 crédits IA mensuels. La génération d’une vidéo via Veo 3.1 en mode « Fast » coûte 20 crédits, tandis que le mode « Quality » en consomme 100. Actuellement, certains utilisateurs rencontrent des échecs de génération, limitant la production aux vidéos générées directement dans l’application Gemini, avec une limite de trois par jour. Veo 3.1 est également déployé sur d’autres plateformes, comme Higgsfield.ai, où Sora 2 est également disponible. L’utilisation sur ces plateformes tierces requiert généralement un abonnement payant, avec des tarifs qui peuvent être plus élevés pour les modèles les plus performants.
La disponibilité de Veo 3.1 s’étend également via l’API Gemini pour des intégrations plus techniques, tandis que l’application Gemini permet sa simple utilisation pour générer des vidéos à partir de descriptions textuelles.
Ressources et informations complémentaires : Blog de Google.