Home Sciences et technologies Cette startup veut déclencher un moment DeepSeek aux États-Unis

Cette startup veut déclencher un moment DeepSeek aux États-Unis

0 comments 42 views

Publié le 2025-10-08 20:30:00. L’émergence des modèles d’intelligence artificielle (IA) open source chinois a catalysé un mouvement pour une IA plus accessible et décentralisée. Une startup, Prime Intellect, développe actuellement un nouveau modèle linguistique en utilisant des méthodes innovantes d’apprentissage par renforcement distribué, promettant de démocratiser la création d’IA compétitives hors des circuits des géants technologiques.

  • Les modèles d’IA open source chinois, initiés notamment par DeepSeek, stimulent l’innovation et plaident pour une diffusion mondiale de la création d’IA.
  • Prime Intellect teste une approche d’apprentissage par renforcement distribué pour son modèle INTELLECT-3, visant à créer une IA ouverte et performante sans dépendre des grandes plateformes technologiques.
  • L’objectif est de rendre la création et la modification d’IA avancée plus accessibles, brisant la dichotomie actuelle entre les modèles fermés américains et les offres chinoises ouvertes.

Depuis le lancement de DeepSeek en janvier, l’écosystème de l’intelligence artificielle open source chinoise a pris son essor, suscitant des appels à une approche encore plus ouverte et globalisée dans le développement de ces technologies. Dans cette mouvance, Prime Intellect, une jeune entreprise spécialisée dans l’IA décentralisée, est sur le point de finaliser un modèle linguistique de grande envergure, baptisé INTELLECT-3. Pour y parvenir, la société a recours à une forme novatrice d’apprentissage par renforcement distribué, une méthode conçue pour affiner les performances du modèle.

Selon Vincent Weisser, PDG de Prime Intellect, cette démarche inaugure une nouvelle voie pour la conception de modèles d’IA ouverts et performants. Elle s’appuie sur un réseau de matériel informatique réparti géographiquement, s’affranchissant ainsi de la dépendance vis-à-vis des infrastructures des grandes entreprises technologiques. Weisser souligne que le paysage actuel de l’IA se divise entre les partisans des modèles américains propriétaires et ceux qui privilégient les solutions chinoises en open source. La technologie développée par Prime Intellect se positionne comme un outil de démocratisation, permettant à un plus grand nombre d’acteurs de créer et de personnaliser leurs propres IA de pointe.

L’amélioration des modèles d’IA ne se limite plus à l’accroissement des données d’entraînement et de la puissance de calcul. Les modèles les plus avancés aujourd’hui utilisent l’apprentissage par renforcement pour parfaire leurs compétences après la phase initiale de pré-entraînement. Que l’objectif soit de maîtriser les mathématiques, de répondre à des questions juridiques complexes ou de résoudre des grilles de Sudoku, l’idée est de faire progresser le modèle en lui faisant expérimenter des situations où le succès et l’échec peuvent être mesurés.

« Ces environnements d’apprentissage par renforcement représentent désormais un goulot d’étranglement pour véritablement faire évoluer les capacités », explique Weisser. Pour surmonter cet obstacle, Prime Intellect a conçu un cadre permettant à quiconque de bâtir son propre environnement d’apprentissage par renforcement, adapté à des tâches spécifiques. L’entreprise assemble ensuite les meilleurs environnements, qu’ils soient issus de ses propres recherches ou de contributions de la communauté, afin d’optimiser INTELLECT-3.

L’auteur a pu expérimenter ce système en tentant de mettre en place un environnement destiné à résoudre des énigmes de type Wordle, développé par Will Brown, un chercheur de Prime Intellect. En observant un petit modèle résoudre ces mots croisés (avec une méthode plus rigoureuse que celle de l’auteur), il est apparu clairement le potentiel de la démarche. Pour un chercheur en IA cherchant à améliorer un modèle, l’idée serait de déployer un parc de GPU pour permettre au modèle de s’entraîner de manière répétée, pendant qu’un algorithme d’apprentissage par renforcement ajuste ses paramètres, transformant ainsi le modèle en un expert en Wordle.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.