Anthropic a dévoilé Opus 4.6, une nouvelle version de son modèle d’intelligence artificielle qui repousse les limites de la performance, notamment en matière de programmation et d’analyse de données complexes. Cette avancée technologique positionne l’entreprise comme un acteur majeur dans la course à l’IA de pointe.
Opus 4.6 se distingue par sa capacité à traiter un volume de données considérablement accru grâce à une fenêtre contextuelle atteignant un million de jetons (en version bêta). Cette fonctionnalité permet au modèle de conserver et d’analyser des informations sur de très longues séquences de texte avec une précision accrue, surpassant les capacités de ses prédécesseurs.
Les améliorations ne se limitent pas à la taille de la fenêtre contextuelle. Anthropic a également optimisé les compétences du modèle en matière de programmation, lui permettant de planifier des tâches complexes de manière plus méthodique et de gérer des référentiels de code de grande envergure avec une fiabilité accrue. Dans les tests d’évaluation, Opus 4.6 a obtenu le meilleur score sur Terminal-Bench 2.0, un benchmark dédié au codage basé sur des agents.
L’entreprise a également mis en avant les performances d’Opus 4.6 dans des domaines clés tels que la finance et le droit. Le modèle a surpassé GPT-5.2 d’OpenAI de 144 points Elo dans l’évaluation GDPval-AA, qui mesure la capacité à résoudre des problèmes de connaissances économiquement pertinents. Il excelle également dans la recherche d’informations en ligne difficiles à trouver, comme le démontre son score supérieur sur BrowseComp.
Au-delà de la performance brute, Anthropic a accordé une attention particulière à la sécurité et au contrôle du comportement d’Opus 4.6. Des évaluations approfondies ont été menées, révélant de faibles taux de réponses inappropriées et un profil de sécurité comparable, voire supérieur, à celui des autres modèles leaders du secteur. L’entreprise a également réduit le taux de rejet excessif, permettant au système d’accepter davantage de requêtes légitimes.
Pour les développeurs, Opus 4.6 offre de nouvelles fonctionnalités via son API, notamment une fonction de « pensée adaptative » qui permet au modèle de décider de manière autonome quand une analyse plus approfondie est nécessaire. Les niveaux d’effort (faible, moyen, élevé, maximum) offrent un contrôle plus précis sur la complexité des tâches. La compression de contexte (en version bêta) permet de gérer les conversations longues et les tâches basées sur des agents en résumant automatiquement les informations antérieures.
Les utilisateurs de Claude et Claude Code bénéficieront également d’améliorations significatives. Les équipes d’agents, disponibles en aperçu, permettent de diviser les tâches complexes en sous-tâches indépendantes, tandis que l’intégration améliorée avec les outils Microsoft Office permet de traiter des données dans Excel et de les visualiser dans PowerPoint de manière plus efficace.
Opus 4.6 est dès à présent disponible sur claude.ai, via l’API et sur les principales plateformes cloud. Le coût reste inchangé, à 5 $ pour l’entrée et 25 $ pour la sortie par million de jetons (environ 5,30 € et 26,50 €). Des informations détaillées sur les prix et les évaluations de performance sont disponibles sur le site web d’Anthropic.