L'IA générative rapproche les robots d'un but général

La plupart des couvertures sur la robotique humanoïde se sont naturellement concentrées sur la conception matérielle. Étant donné la fréquence à laquelle leurs développeurs utilisent l'expression "humanoïdes à usage général", il conviendrait de prêter plus d'attention au premier aspect. Après des décennies de systèmes à usage unique, le passage à des systèmes plus généralisés sera important. Nous n'y sommes simplement pas encore.

La volonté de produire une intelligence robotique capable de tirer pleinement parti de la large gamme de mouvements ouverts par la conception humanoïde bipède a été un sujet clé pour les chercheurs. L'utilisation de l'IA générative en robotique est également un sujet brûlant ces derniers temps. De nouvelles recherches de l'MIT indiquent comment cette dernière pourrait affecter profondément la première.

Un des plus grands défis sur la route des systèmes à usage général est la formation. Nous avons une bonne compréhension des meilleures pratiques pour former les humains à différentes tâches. Les approches en robotique, bien que prometteuses, sont fragmentées. Il existe de nombreuses méthodes prometteuses, y compris l'apprentissage par renforcement et par imitation, mais les solutions futures impliqueront probablement des combinaisons de ces méthodes, augmentées par des modèles d'IA générative.

Un des cas d'utilisation principaux suggérés par l'équipe de l'MIT est la capacité à recueillir des informations pertinentes à partir de ces petits ensembles de données spécifiques à une tâche. La méthode a été baptisée composition de politique (PoCo). Les tâches incluent des actions robotiques utiles comme enfoncer un clou et retourner des choses avec une spatule.

"[Les chercheurs] entraînent un modèle de diffusion séparé pour apprendre une stratégie, ou politique, pour accomplir une tâche à l'aide d'un ensemble de données spécifique", note l'école. "Puis ils combinent les politiques apprises par les modèles de diffusion en une politique générale qui permet à un robot d'accomplir de multiples tâches dans divers environnements."

D'après l'MIT, l'incorporation des modèles de diffusion a amélioré les performances des tâches de 20%. Cela inclut la capacité d'exécuter des tâches nécessitant plusieurs outils, ainsi que d'apprendre et de s'adapter à des tâches inconnues. Le système est capable de combiner des informations pertinentes de différents ensembles de données en une chaîne d'actions requise pour exécuter une tâche.

"L'un des avantages de cette approche est que nous pouvons combiner des politiques pour obtenir le meilleur des deux mondes", déclare l'auteur principal de l'article, Lirui Wang. "Par exemple, une politique formée sur des données du monde réel pourrait être capable d'atteindre plus de dextérité, tandis qu'une politique formée sur une simulation pourrait être capable d'atteindre plus de généralisation."

L'objectif de ce travail spécifique est la création de systèmes d'intelligence permettant aux robots d'échanger différents outils pour accomplir différentes tâches. La prolifération de systèmes polyvalents rapprocherait l'industrie du rêve à usage général d'un pas de plus.