Home Sciences et technologies Google lance Gemini 3.1 Pro et promet de meilleures performances de raisonnement

Google lance Gemini 3.1 Pro et promet de meilleures performances de raisonnement

0 comments 15 views

Google vient de dévoiler Gemini 3.1 Pro, une mise à niveau significative de sa famille de modèles d’intelligence artificielle, promettant une amélioration notable de ses capacités de raisonnement et de résolution de problèmes. Cette nouvelle version, déjà accessible aux développeurs et aux entreprises, vise à intégrer les avancées récentes de l’IA dans des applications concrètes au quotidien.

Selon Google, Gemini 3.1 Pro affiche une performance en matière de raisonnement plus que doublée par rapport à son prédécesseur, Gemini 3 Pro, sur le benchmark exigeant ARC-AGI-2, atteignant un score de 77,1 % contre 31,1 %. L’entreprise affirme que ce résultat surpasse également les performances d’autres modèles concurrents tels qu’Opus 4.6 d’Anthropic (68,8 %) et GPT-5.2 d’OpenAI (52,9 %).

Les améliorations ne s’arrêtent pas là. Gemini 3.1 Pro excelle également sur d’autres tests de référence, notamment GPQA Diamond pour les connaissances scientifiques (94,3 %), SWE-Bench Verified pour le codage (80,6 %, comparable à Opus 4.6 à 80,8 %), ainsi que sur des benchmarks d’agents conversationnels comme MCP Atlas (69,2 %) et BrowseComp (85,9 %). Sur LiveCodeBench Pro, un test de codage compétitif, le modèle a obtenu un score Elo de 2 887, surpassant Gemini 3 Pro (2 439) et GPT-5.2 (2 393).

Cependant, Gemini 3.1 Pro n’est pas systématiquement en tête de tous les classements. Sur le benchmark multimodal MMMU Pro, Gemini 3 Pro conserve une légère avance (81,0 % contre 80,5 %). De plus, Opus 4.6 d’Anthropic se distingue par une meilleure efficacité dans l’utilisation des outils, avec un score de 53,1 % sur un test évaluant cette capacité.

Google souligne que les benchmarks, bien qu’utiles, ne reflètent pas toujours les performances réelles. L’entreprise encourage les utilisateurs à tester le nouveau modèle avec leurs propres requêtes afin d’évaluer concrètement les améliorations apportées. Gemini 3.1 Pro est conçu pour faciliter l’interaction avec des API complexes, en rendant l’intelligence artificielle plus accessible.

En guise d’exemple, Google cite la capacité du modèle à configurer un flux de télémétrie public pour visualiser l’orbite de la Station spatiale internationale, ou encore à générer des graphiques SVG animés à partir de simples instructions textuelles, directement intégrables sur des sites web.

Gemini 3.1 Pro est désormais disponible pour les développeurs via l’API Gemini, Google AI Studio, Gemini CLI, la plateforme de développement d’agents Google Antigravity et Android Studio. Les entreprises peuvent y accéder via Vertex AI et Gemini Enterprise. Les utilisateurs finaux peuvent l’utiliser via l’application Gemini et NotebookLM (pour les abonnés Pro et Ultra).

Les tarifs de l’API sont alignés sur ceux de Gemini 3 Pro et restent inférieurs à ceux des modèles Opus d’Anthropic. Pour l’entrée de données, le coût est de 2,00 USD (environ 1,86 EUR) par million de jetons pour les requêtes inférieures à 200 000 jetons et de 4,00 USD (environ 3,72 EUR) pour les requêtes plus importantes. La sortie de données coûte 12,00 USD (environ 11,16 EUR) par million de jetons pour les requêtes inférieures à 200 000 jetons et 18,00 USD (environ 16,74 EUR) pour les requêtes plus importantes. La mise en cache est facturée 0,20 USD (environ 0,19 EUR) et 0,40 USD (environ 0,37 EUR) par million de jetons, tandis que la mémoire cache coûte 4,50 USD (environ 4,18 EUR) par million de jetons et par heure. Enfin, la fonction de recherche offre 5 000 requêtes gratuites par mois, puis 14,00 USD (environ 12,98 EUR) par 1 000 requêtes supplémentaires.

Gemini 3.1 Pro reste actuellement en phase d’aperçu. Google prévoit d’intégrer les retours des utilisateurs, notamment concernant les « flux de travail agents ambitieux », avant de lancer une version définitive.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.