Home Sciences et technologies Comment Zoom aborde l’IA agentique

Comment Zoom aborde l’IA agentique

0 comments 45 views

Publié le 2025-11-03 11:05:00. Zoom ambitionne de métamorphoser son assistant numérique, alimenté par intelligence artificielle (IA), en un véritable agent autonome, capable de comprendre le contexte des réunions et d’agir de manière indépendante. Cette évolution s’appuie sur une architecture d’IA dite « agentique », définie par quatre piliers fondamentaux.

  • Une mémoire à long terme persistante, dépassant la seule conversation en cours.
  • Une capacité de raisonnement approfondi pour saisir l’intention des échanges et achever des tâches.
  • La faculté d’orchestrer divers outils et agents spécialisés pour accomplir des objectifs complexes.
  • Une approche proactive et autonome, anticipant les besoins de l’utilisateur.

Lors d’une récente visite à Singapour, Xuedong Huang, directeur de la technologie chez Zoom, a détaillé les avancées de la dernière version de l’assistant numérique de l’entreprise, AI Companion 3.0. Ce dernier repose sur une architecture d’IA agentique caractérisée par quatre attributs clés.

Le premier pilier est une mémoire à long terme persistante, essentielle pour que l’agent IA puisse saisir l’historique des interactions, des réunions et des décisions. Contrairement aux chatbots classiques qui perdent rapidement le fil, un agent doté d’une mémoire solide peut offrir une vision d’ensemble plus pertinente. « Nous possédons tous une mémoire à long terme, donc l’IA doit en avoir une bonne », a souligné Xuedong Huang, ajoutant que Zoom, de par sa plateforme de discussions professionnelles, est idéalement positionné pour développer cette capacité.

Le deuxième attribut réside dans la faculté d’effectuer un raisonnement approfondi. Cela permet aux agents IA de comprendre les intentions profondes des conversations et de mener à bien les tâches requises, jusqu’à ce que la boucle soit bouclée, selon la vision de M. Huang. Ce raisonnement permet à l’IA d’identifier les actions prioritaires à entreprendre à l’issue d’une discussion. Par exemple, elle pourrait conclure qu’un compte-rendu par e-mail, une nouvelle entrée dans un plan de projet, ou la planification d’une réunion sont nécessaires, sans qu’une commande explicite ne soit formulée.

Aucun outil ne pouvant tout faire seul, le troisième attribut de l’IA agentique est son rôle de chef d’orchestre. Il est capable de coordonner l’action de plusieurs outils ou d’autres agents spécialisés pour atteindre un objectif complexe. Il peut ainsi intégrer différentes fonctionnalités pour exécuter une tâche en plusieurs étapes. Par exemple, pour organiser le suivi d’une réunion de planification trimestrielle, un agent IA pourrait devoir consulter la transcription, rédiger un résumé avec un outil de traitement de texte, planifier des sessions de suivi via le calendrier, et envoyer des communications par e-mail, le tout s’inscrivant dans un flux de travail cohérent.

Enfin, l’IA agentique doit faire preuve de proactivité et d’autonomie. Plutôt que d’attendre des instructions, elle anticipe les besoins de l’utilisateur et prend des initiatives. Xuedong Huang a contrasté cette approche avec celle des modèles d’IA actuellement populaires :

« ChatGPT, tel que nous le connaissons aujourd’hui, est passif. Il n’est pas conçu pour exécuter des tâches en votre nom. Vous avez eu une réunion Zoom, mais ChatGPT ne sait pas de quoi il s’agit. »

Xuedong Huang, directeur de la technologie chez Zoom

À l’inverse, un agent IA serait non seulement informé du contenu des discussions, mais proposerait également les étapes suivantes, voire commencerait à les exécuter.

Une architecture fédérée pour l’IA

Au cœur de ces agents IA se trouve l’approche fédérée de l’IA adoptée par Zoom depuis la première version d’AI Companion. Plutôt que de s’appuyer sur un unique grand modèle de langage (LLM), Zoom exploite une combinaison de modèles issus de différents fournisseurs, tels qu’OpenAI et Anthropic, ainsi que ses propres petits modèles de langage (SLM) optimisés pour des tâches spécifiques comme la synthèse ou la traduction.

Cette fédération ne se limite pas aux modèles eux-mêmes, mais concerne également leur interaction via un processus appelé mise à l’échelle de l’inférence. Par exemple, pour résumer une réunion, AI Companion utilise d’abord le SLM de Zoom pour un traitement initial rapide et économique, générant un premier jet. Ce résumé est ensuite transmis à un LLM plus puissant, comme GPT-4, pour un affinage linguistique, structurel et nuancé. Cette stratégie permet d’utiliser les modèles les plus coûteux et performants uniquement lorsque nécessaire, tandis que les modèles spécialisés moins onéreux gèrent la majeure partie du traitement.

Xuedong Huang a souligné que ce « comité de modèles » assure également une supervision et un contrôle accrus des résultats de l’IA. « Grâce à la puissance de notre fédération, nous disposons d’un comité capable de détecter les risques et les problèmes de sécurité mieux qu’un seul composant », a-t-il déclaré, affirmant que la diversité des modèles rend intrinsèquement le système plus robuste et sécurisé.

Pour les organisations nécessitant une IA agentique plus personnalisée, AI Companion personnalisé offre la possibilité de créer et de déployer des agents IA sur mesure grâce à un outil low-code, donnant accès à une bibliothèque d’outils et de modèles prédéfinis pour divers flux de travail. Les administrateurs peuvent également intégrer des agents tiers préconfigurés et utiliser le Protocole Agent2Agent (A2A) pour des interactions avec des applications telles que ServiceNow.

Plus récemment, Zoom a annoncé un partenariat avec Nvidia afin de renforcer davantage ses capacités en matière d’IA agentique. Cet accord inclut l’intégration des modèles de raisonnement Nemotron dans son architecture de modèles fédérés, l’exploitation des puces graphiques et de la pile logicielle d’IA de Nvidia pour optimiser les fonctionnalités de base d’AI Companion, et le développement de son nouveau LLM de 49 milliards de paramètres basé sur Nemotron.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.