Home Sciences et technologies Google Gemini 3.1 Pro est là et bat ses rivaux dans les principaux benchmarks de l’IA

Google Gemini 3.1 Pro est là et bat ses rivaux dans les principaux benchmarks de l’IA

0 comments 34 views

Publié le 20 juillet 2024 à 10h30. Google vient de dévoiler une nouvelle version améliorée de son modèle d’intelligence artificielle, Gemini 3.1 Pro, qui surpasse ses concurrents dans plusieurs tests de référence et promet des capacités de raisonnement plus avancées.

  • Gemini 3.1 Pro excelle dans les tâches nécessitant un raisonnement complexe, notamment en matière de logique abstraite et de connaissances scientifiques.
  • Les tests comparatifs montrent que Gemini 3.1 Pro surpasse GPT-5.2 et Claude Opus 4.6 dans plusieurs benchmarks clés.
  • La nouvelle version est désormais disponible pour les utilisateurs de Gemini, avec des limites d’utilisation variables selon l’abonnement.

Google continue d’améliorer ses modèles d’IA avec le lancement de Gemini 3.1 Pro, une mise à jour significative de Gemini 3 Pro. Selon Google, cette nouvelle itération est conçue pour les problèmes qui dépassent les simples réponses directes, offrant un raisonnement avancé pour relever les défis les plus complexes.

« Gemini 3.1 Pro est conçu pour les tâches pour lesquelles une réponse simple ne suffit pas, en prenant un raisonnement avancé et en le rendant utile pour vos défis les plus difficiles », a déclaré Google.

Google

Les résultats des tests comparatifs, notamment l’évaluation ARC-AGI-2, démontrent la supériorité de Gemini 3.1 Pro. Il surpasse la version précédente de Gemini par un facteur de deux dans les énigmes de raisonnement abstrait. Plus impressionnant encore, il obtient un score de 77,1 %, contre 52,9 % pour GPT-5.2 et 68,8 % pour Claude Opus 4.6. Au total, Google a devancé ses concurrents, OpenAI et Anthropic, dans 12 des 19 benchmarks testés.

Gemini 3.1 Pro se distingue également par ses performances dans le test GPQA Diamond, qui évalue les connaissances scientifiques des modèles d’IA, avec un score de 94,3 %. GPT-5.2 a obtenu un score de 92,4 %, suivi de Claude Opus 4.6 avec 91,3 %.

La nouvelle version est accessible dès maintenant via l’application Gemini ou un navigateur web. Les utilisateurs gratuits bénéficieront d’un accès limité, tandis que les abonnés payants auront une limite d’utilisation plus élevée. Pour sélectionner Gemini 3.1 Pro, il suffit de cliquer sur le nom du modèle dans la fenêtre de dialogue et de choisir l’option « Mathématiques et code avancés avec 3.1 Pro ».

Gemini 3.1 Pro est également intégré à NotebookLM de Google, mais son utilisation nécessite un abonnement AI Pro ou AI Ultra.

Note : Ziff Davis, la société mère de PCMag, a intenté une action en justice contre OpenAI en avril 2025, alléguant une violation des droits d’auteur dans la formation et l’exploitation de ses systèmes d’IA.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.