Formation de l’IA: interaction humaine vs ensembles de données traditionnels

Les chercheurs de Duke développent « GUIDE”- ⁤a NOUVELLE Méthode Training‌ Training‌ Tiration de la rétroaction humaine en temps réel

Une percée de Université DukeLa robotique générale ⁢Lab promet d’accélérer considérablement l’adaptabilité de l’ADN d’apprentissage de l’IA, d’aller au-delà des limites des ensembles de données conventionnels et l’apprentissage du renforcement. La nouvelle méthode, surnommée Guide⁢ (guidé ‌oundant à travers une évaluation incrémentielle et dynamique), permet à AI ⁣o de apprendre directement à partir de la rétroaction humaine nuancée et à temps réel, d’achat de performances substantielles dans les gains de performances complexes.

Pendant des années, un défi de base dans l’intelligence artificielle a commis l’écart entre l’apprentissage théorique et la application ⁤ ⁤ ⁤ ⁣ pratiques. ‌Reavale de l’IA traditionnelle s’appuie sur les ensembles de données massifs et préexistants, qui peuvent être coûteux à créer, biaisés et suffisamment souvent à généraliser à de nouvelles ⁣Situations. L’apprentissage du renforcement, bien que prometteur, lutte souvent avec des vitesses d’apprentissage lentes et la difficulté de concevoir des fonctions de récompense efficaces. Ces limites entravent les progrès‌ de l’IA vraiment adaptable capable de fonctionner efficacement dans le monde réel.

Dr Jean-Claude Chen, professeur agrégé de génie informatique et d’informatique à l’Université Duke »et ⁣Director of the Duke Laboratoire de robotique généralEt son équipe relève de front ce défi. Leur travail renforce un ensemble croissant de recherches axées sur l’apprentissage en boucle humaine, mais se distingue par son approche innovante des mécanismes de rétroaction.

«Les méthodes de formation existantes sont souvent limitées par leur dépendance à l’égard des ensembles de données préexistants étendus tout en luttant avec l’adaptabilité limité des approches de rétroaction traditionnelles», explique le Dr Chen. «Nous avons cherché à combler cette lacune en incorporant la rétroaction humaine continue en temps réel.»

Guide change fondamentalement la voie à l’apprentissage. ‍ Au lieu de s’appuyer sur de simples signaux «bons / mauvais», le guide permet aux entraîneurs humains⁢ de proposer une rétroaction continue et nuancée en survolant un curseur de souris sur une échelle de gradient. Cette rétroaction subtile et continue »permet au ⁢AI de développer une compréhension plus profonde de la tâche à accomplir et d’adapter sa stratégie plus efficacement.

(Démontrant EEAT – L’expérience et les résultats de cache-cache)

Pour démontrer l’efficacité de Guide, les chercheurs ont utilisé un cas de test compliquant: un jeu de cache-cache avec deux agents d’IA en forme de bobe, un rouge (The Seeker) et un Green⁢ (The Hider). Le jeu se déroule sur ⁤a Square Field avec une barrière centrale, initialement obscurci du point de vue du chercheur. L’agent de l’IA rouge ‍ était au centre de la formation, recevant des commentaires des participants humains comme ⁤It a recherché l’agent vert. L’étude, impliquant 50 participants adultes⁢ sans ‍Prior Ai, représente l’étude la plus grande enquête. Les résultats étaient frappants: Seulement 10 minutes de rétroaction humaine ont entraîné une augmentation ‌a ‍30% du taux de réussite de l’AI’S⁤ par rapport aux méthodes d’apprentissage par le renforcement de pointe.

«Cette forte preuve quantitative et qualitative met en évidence l’efficacité de notre approche», explique Lingyu Zhang, l’auteur principal et un doctorant de première année dans le laboratoire de Chen.

(Fiduisine et implications futures – ‍Beyond L’étude initiale)

L’innovation de l’équipe s’étend au-delà du mécanisme de rétroaction lui-même. Ils ont découvert que les ⁢Traineurs humains ne sont pas nécessaires indéfiniment. ‌ En analysant les commentaires fournis, ils sont capables de créer un «entraîneur humain simulé», permettant au chercheur AI de continuer à apprendre même après que le participant humain ait fini de fournir des conseils.

Cette approche apparemment contre-intuitive – former un coach Ai ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ ⁢ Ce n’est pas aussi habile que l’IA qu’elle coaching – est fondée sur une compréhension fondamentale de l’expertise humaine. Comme le souligne le Dr Chen, «Bien qu’il soit très ardu pour quelqu’un de maîtriser une certaine tâche, il n’est pas si difficile pour quelqu’un de juger s’ils s’améliorent ou non.

Une analyse plus approfondie a révélé que les différences individuelles dans les capacités cognitives humaines, telles que le raisonnement spatial et la prise de décision rapide, ont eu un impact significatif sur l’efficacité des conseils de l’IA. Cela ouvre des voies passionnantes pour les recherches sur l’amélioration des CALIBILITÉS »par la formation ciblée et l’identification d’autres facteurs qui contribuent à la ⁣Prosperous collaboration humaine-AI.

(Aborder l’intention des utilisateurs – l’avenir des équipes humaines-ai)

Les implications du guide sont d’une grande portée. Les chercheurs envisagent un avenir où les systèmes d’IA sont non seulement plus intelligents mais aussi plus intuitifs et accessibles aux utilisateurs de tous les jours. Cela inclut l’intégration de la communication diversifiée ‍ des signaux – langue, expressions faciales, gestes de la main – pour créer un cadre d’apprentissage plus complet et plus complet.

En fin de compte, l’objectif est de construire la prochaine génération de systèmes intelligents qui s’associent de manière transparente avec les humains pour lutter contre les tâches complexes qui ne pourraient rien résoudre seul. «Alors que les technologies de l’IA deviennent plus répandues, ‍ Ce sont des systèmes de conception cruciaux qui sont intuitifs et accessibles aux utilisateurs de tous les jours», conclut le Dr Chen. «Guide ouvre la façon dont la manière plus intelligente

Nom complet: Linda Park Rôle: éditeur, Tech Catégorie: Tech Lieu: San Francisco, États-Unis Education: MSC en informatique, Stanford University Experience: 9+ Years in Technology Journalism and Software Development Expertise: Artificial Intelligence Journaliste et éditeur technologique avec une solide expérience en génie logiciel et en innovation numérique. Elle est titulaire d’un MSC en informatique de l’Université de Stanford. Linda est passionnée de rendre la technologie accessible et engageante, en mettant l’accent sur l’IA, les gadgets et les dernières tendances technologiques. En tant que rédactrice de la section technologique de World Today Journal, elle fournit des critiques approfondies, des nouvelles et des analyses d’experts à un public mondial.

Formation de l’IA: interaction humaine vs ensembles de données traditionnels

Les chercheurs de Duke développent « GUIDE”- ⁤a NOUVELLE Méthode Training‌ Training‌ Tiration de la rétroaction humaine en temps réel

Related

Leave a Comment Cancel Reply

À propos de nous

Formation de l’IA: interaction humaine vs ensembles de données traditionnels

Les chercheurs de Duke développent « GUIDE”- ⁤a NOUVELLE Méthode Training‌ Training‌ Tiration de la rétroaction humaine en temps réel

En rapport

Partager :

Related

Leave a Comment Cancel Reply

Le budget britannique: une opportunité manquée de croissance?

Minuscules plastiques dans les artères: avertissement de risque de crise cardiaque

Tu pourrais aussi aimer

À propos de nous