Home Économie Meilleur codage et immense fenêtre contextuelle

Meilleur codage et immense fenêtre contextuelle

0 comments 18 views

Mis à jour le 18 février 2024. Anthropic améliore ses modèles d’intelligence artificielle avec le lancement de Sonnet 4.6, une version plus performante et dotée d’une capacité de traitement considérablement accrue, destinée aux utilisateurs des forfaits Free et Pro.

  • Sonnet 4.6, le modèle intermédiaire d’Anthropic, excelle désormais dans les tâches de codage, le suivi d’instructions et l’utilisation informatique.
  • La fenêtre contextuelle de Sonnet 4.6 a été doublée en version bêta, atteignant un million de tokens (environ 750 000 mots), permettant de traiter des projets complexes en une seule requête.
  • Les benchmarks révèlent des performances impressionnantes, notamment un score de 60,4% à l’ARC-AGI-2, un test d’intelligence humaine.

Deux semaines après le déploiement d’Opus 4.6, son modèle phare, Anthropic renforce son offre avec une mise à jour significative de Sonnet, un pilier de sa gamme d’IA. Cette évolution, qui s’inscrit dans un cycle de développement quadrimestriel, cible trois domaines clés pour les entreprises : le codage, la capacité à suivre des instructions précises et l’efficacité dans l’exécution de tâches informatiques. Ces améliorations répondent à un enjeu crucial, celui de différencier les modèles de milieu de gamme, essentiels pour les applications professionnelles quotidiennes.

L’innovation la plus notable réside dans l’augmentation spectaculaire de la fenêtre contextuelle. En phase de test, elle a doublé pour atteindre un million de tokens. Selon Anthropic, cette capacité permet d’intégrer des bases de code complètes, des contrats volumineux ou des dizaines d’articles de recherche dans une seule requête. Cela signifie que les utilisateurs peuvent soumettre l’intégralité d’un projet sans avoir à le fragmenter, et demander à l’IA de l’analyser globalement.

Bien qu’un million de tokens ne soit pas une exclusivité – Gemini propose déjà des fenêtres contextuelles similaires – cette avancée est particulièrement importante pour Sonnet, le modèle le plus couramment utilisé par les clients d’Anthropic. Elle représente un gain de productivité significatif pour les professionnels.

Les tests de performance confirment les progrès de Sonnet 4.6. Le modèle a obtenu de meilleurs résultats que ses prédécesseurs sur OS World pour les tâches informatiques et sur SWE-Bench pour l’ingénierie logicielle. Plus significatif encore, il a atteint un score de 60,4% à l’ARC-AGI-2, un test conçu pour évaluer les capacités cognitives proches de celles de l’humain, le plaçant ainsi au-dessus de nombreux autres modèles disponibles.

Il est toutefois important de noter que Sonnet 4.6 reste en deçà des performances d’Opus 4.6, de Gemini 3 Deep Reflection et d’une version optimisée de GPT-5.2, ce qui est logique compte tenu de sa positionnement tarifaire. Sonnet se veut le meilleur compromis entre performance et coût, et les données semblent confirmer cette stratégie.

Anthropic prévoit de mettre à jour prochainement Haïku, son modèle le plus petit et le plus rapide, complétant ainsi la gamme de ses outils d’intelligence artificielle.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.