Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes

Des chercheurs du mit et de NVIDIA ont développé cuTAMP, un nouvel algorithme qui utilise la puissance des GPU pour la planification parallèle. Au lieu de tests lents et séquentiels, le robot analyse maintenant des milliers de mouvements possibles simultanément, résolvant des tâches complexes de manipulation et d'emballage en quelques secondes seulement.

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes
Photo by: Domagoj Skledar/ arhiva (vlastita)

Imaginez que vous vous préparez pour des vacances longuement attendues. Vous êtes confronté au défi de faire une valise : tous les objets nécessaires doivent y rentrer sans que rien de fragile ne se brise. Pour les humains, grâce à nos capacités visuelles et spatiales, il s'agit d'un problème généralement soluble, même s'il demande un peu d'arrangement créatif. Cependant, pour un robot, cela représente une tâche de planification extrêmement complexe qui exige la prise en compte simultanée d'innombrables actions, contraintes et possibilités mécaniques. Trouver une solution efficace pourrait prendre un temps extrêmement long, si tant est que le robot parvienne à en trouver une.


Mais une équipe de scientifiques composée de chercheurs du prestigieux Massachusetts Institute of Technology (MIT) et du géant de la technologie NVIDIA a mis au point un algorithme révolutionnaire qui accélère considérablement ce processus. Leur approche innovante permet au robot de littéralement « penser à l'avance », en évaluant des milliers de plans de mouvement potentiels en parallèle, puis en affinant les meilleurs pour satisfaire toutes les conditions fixées par le robot et l'environnement. Au lieu de tester chaque action possible une par une, comme le font les méthodes existantes, cette nouvelle méthode en examine des milliers simultanément, résolvant des problèmes de manipulation complexes et multi-étapes en quelques secondes seulement.


Une révolution dans la planification : De l'approche séquentielle à l'approche parallèle


La clé de cette vitesse incroyable réside dans l'utilisation de l'immense puissance de calcul de processeurs spécialisés connus sous le nom d'unités de traitement graphique (GPU). Dans des environnements comme les usines ou les entrepôts, cette technique pourrait permettre aux robots de déterminer à la vitesse de l'éclair comment manipuler et emballer de manière dense des objets de formes et de tailles variées sans les endommager, les faire tomber ou entrer en collision avec des obstacles, même dans des espaces très restreints. Ceci est crucial dans les environnements industriels où le temps, c'est littéralement de l'argent et où il est nécessaire de trouver une solution efficace dans les plus brefs délais.


William Shen, diplômé du MIT et auteur principal de l'article scientifique sur cette technique, souligne : « Si votre algorithme met des minutes à trouver un plan, contre quelques secondes, cela coûte directement à l'entreprise. » Les algorithmes traditionnels de planification de tâches et de mouvements (TAMP) sont souvent confrontés à ce que l'on appelle une « explosion combinatoire » : le nombre de séquences d'actions possibles augmente de manière exponentielle avec chaque nouvel objet ou étape, rendant le problème presque insoluble en temps réel. La plupart de ces actions essayées au hasard ne mènent à aucun résultat productif, ce qui ralentit encore le processus.


Au cœur de l'innovation : La puissance des processeurs graphiques (GPU)


L'algorithme, nommé cuTAMP, est accéléré grâce à la plateforme de calcul parallèle CUDA, développée par NVIDIA même. Cette plateforme permet aux développeurs d'exploiter tout le potentiel des GPU pour des tâches de calcul générales, bien au-delà de leur objectif initial de génération de graphiques informatiques. Les GPU sont conçus avec des milliers de cœurs qui peuvent exécuter des opérations simultanément, ce qui les rend idéaux pour les tâches qui peuvent être divisées en de nombreuses petites parties indépendantes – exactement comme la simulation de milliers de plans différents pour un robot.


Caelan Garrett, chercheur scientifique principal chez NVIDIA Research, explique : « L'espace de recherche est énorme, et de nombreuses actions que le robot effectue dans cet espace n'accomplissent en fait rien de productif. » En utilisant un GPU, le coût de calcul de l'optimisation d'une solution devient presque identique au coût de l'optimisation de centaines ou de milliers de solutions. Il s'agit d'un changement de paradigme fondamental qui ouvre la voie à la résolution de problèmes jusqu'alors considérés comme trop complexes pour une automatisation en temps réel.


Comment « pense » cuTAMP ? Une combinaison d'échantillonnage et d'optimisation


L'équipe de recherche a conçu l'algorithme spécifiquement pour ce que l'on appelle la planification de tâches et de mouvements (TAMP). L'objectif d'un algorithme TAMP est de créer un double plan pour le robot : un plan de tâches, qui représente une séquence d'actions de haut niveau (par exemple, « prendre l'objet A », « mettre l'objet A dans la boîte »), et un plan de mouvements, qui inclut des paramètres d'action de bas niveau tels que les positions exactes des articulations du bras et l'orientation de la pince pour exécuter ce plan.


Pour créer un plan d'emballage d'objets, le robot doit réfléchir à de nombreuses variables. Celles-ci incluent l'orientation finale des objets emballés pour qu'ils s'ajustent, ainsi que la manière dont il les soulèvera et les manipulera à l'aide de son bras et de sa pince, tout en évitant les collisions et en respectant les contraintes définies par l'utilisateur, comme l'ordre d'emballage.


L'algorithme cuTAMP atteint son efficacité en combinant deux techniques puissantes : l'échantillonnage intelligent et l'optimisation parallèle.


Échantillonnage intelligent : Au lieu de choisir au hasard des solutions potentielles, cuTAMP restreint la gamme des solutions possibles à celles qui sont les plus susceptibles de satisfaire les contraintes du problème. Cette procédure d'échantillonnage modifiée permet à l'algorithme d'explorer largement les solutions potentielles, mais dans un espace restreint et prometteur. « Une fois que nous combinons les sorties de ces échantillons, nous obtenons un bien meilleur point de départ que si nous avions échantillonné au hasard. Cela garantit que nous pouvons trouver des solutions plus rapidement lors de l'optimisation », explique Shen.


Optimisation parallèle : Après avoir généré un ensemble d'échantillons, cuTAMP exécute une procédure d'optimisation parallélisée. Il calcule un « coût » pour chaque échantillon, qui correspond à la manière dont cet échantillon évite les collisions, respecte les contraintes de mouvement du robot et atteint les objectifs définis par l'utilisateur. L'algorithme met ensuite à jour tous les échantillons simultanément, sélectionne les meilleurs candidats et répète le processus jusqu'à ce qu'il les réduise à une seule solution réussie et réalisable.


Application pratique et tests : De la simulation au monde réel


Lorsque les chercheurs ont testé leur approche sur des défis d'emballage simulés de type Tetris, cuTAMP n'a eu besoin que de quelques secondes pour trouver des plans réussis et sans collision, des tâches qui prendraient beaucoup plus de temps aux approches séquentielles, si tant est qu'elles puissent les résoudre. Plus important encore, lorsqu'il a été appliqué à un bras robotique réel, l'algorithme a toujours trouvé une solution en moins de 30 secondes.


Le système est conçu pour être générique et fonctionner sur différents robots. Il a été testé avec succès sur un bras robotique au MIT et sur un robot humanoïde dans les laboratoires de NVIDIA. L'un des avantages clés est que cuTAMP n'est pas un algorithme d'apprentissage automatique et ne nécessite donc pas de données d'entraînement. Cela lui permet d'être facilement appliqué à de nombreuses nouvelles situations. « Vous pouvez lui donner un problème complètement nouveau et il est prouvé qu'il le résoudra », ajoute Garrett. Cette généralisation s'étend également à des situations au-delà de l'emballage, comme des robots utilisant des outils. Un utilisateur pourrait intégrer différents types de compétences dans le système pour étendre automatiquement les capacités du robot.


L'avenir de la manipulation autonome : Plus que de simples boîtes à empiler


Bien que l'emballage soit un excellent exemple de complexité, les applications potentielles de cette technologie sont bien plus larges. Dans la fabrication, les robots pourraient effectuer des tâches d'assemblage complexes nécessitant une manipulation précise de plusieurs composants. En logistique, ils pourraient optimiser le chargement et le déchargement des camions, en maximisant l'utilisation de l'espace. Dans les laboratoires scientifiques, ils pourraient manipuler des équipements et des échantillons sensibles, réduisant ainsi le risque d'erreur humaine.


À l'avenir, les chercheurs souhaitent exploiter les grands modèles de langage (LLM) et les modèles vision-langage au sein de cuTAMP. Cela permettrait au robot de formuler et d'exécuter un plan qui atteint des objectifs spécifiques sur la base des commandes vocales de l'utilisateur. Par exemple, vous pourriez dire au robot : « Prépare-moi mon sac de plage », et il concevrait et exécuterait de manière autonome la manière la plus efficace de l'emballer, en utilisant des capteurs visuels pour identifier des objets comme une serviette, de la crème solaire et un livre. Cette étape représente un lien crucial entre le langage humain abstrait et l'action physique concrète du robot, ouvrant la porte à une ère où les robots deviendront des partenaires encore plus intuitifs et utiles dans la vie quotidienne et au travail.

Source : Massachusetts Institute of Technology

Greška: Koordinate nisu pronađene za mjesto:
Heure de création: 19 heures avant

AI Lara Teč

AI Lara Teč est une journaliste IA innovante de notre portail mondial, spécialisée dans la couverture des dernières tendances et réalisations dans le monde de la science et de la technologie. Grâce à sa connaissance experte et à son approche analytique, Lara fournit des insights approfondis et des explications sur les sujets les plus complexes, les rendant accessibles et compréhensibles pour tous les lecteurs à travers le monde.

Analyse Experte et Explications Claires Lara utilise son expertise pour analyser et expliquer des sujets scientifiques et technologiques complexes, en se concentrant sur leur importance et leur impact sur la vie quotidienne. Qu'il s'agisse des dernières innovations technologiques, des percées dans la recherche ou des tendances dans le monde numérique, Lara offre des analyses approfondies et des explications, mettant en lumière les aspects clés et les implications potentielles pour les lecteurs.

Votre Guide à Travers le Monde de la Science et de la Technologie Les articles de Lara sont conçus pour vous guider à travers le monde complexe de la science et de la technologie, en fournissant des explications claires et précises. Sa capacité à décomposer des concepts complexes en parties compréhensibles fait de ses articles une ressource indispensable pour tous ceux qui souhaitent rester informés des dernières avancées scientifiques et technologiques.

Plus qu'une IA - Votre Fenêtre sur le Futur AI Lara Teč n'est pas seulement une journaliste ; elle est une fenêtre sur l'avenir, offrant des aperçus sur de nouveaux horizons en science et en technologie. Son expertise et son analyse approfondie aident les lecteurs à comprendre et à apprécier la complexité et la beauté des innovations qui façonnent notre monde. Avec Lara, restez informé et inspiré par les dernières réalisations que le monde de la science et de la technologie a à offrir.

AVIS À NOS LECTEURS
Karlobag.eu fournit des actualités, des analyses et des informations sur les événements mondiaux et les sujets d'intérêt pour les lecteurs du monde entier. Toutes les informations publiées sont fournies à titre informatif uniquement.
Nous soulignons que nous ne sommes pas des experts dans les domaines scientifique, médical, financier ou juridique. Par conséquent, avant de prendre toute décision basée sur les informations de notre portail, nous vous recommandons de consulter des experts qualifiés.
Karlobag.eu peut contenir des liens vers des sites externes de tiers, y compris des liens affiliés et des contenus sponsorisés. Si vous achetez un produit ou un service via ces liens, nous pouvons percevoir une commission. Nous n'avons aucun contrôle sur le contenu ou les politiques de ces sites et déclinons toute responsabilité quant à leur exactitude, leur disponibilité ou toute transaction effectuée via ces liens.
Si nous publions des informations sur des événements ou des ventes de billets, veuillez noter que nous ne vendons pas de billets, ni directement ni par l'intermédiaire. Notre portail informe uniquement les lecteurs des événements et des possibilités d'achat via des plateformes de vente externes. Nous mettons en relation les lecteurs avec des partenaires offrant des services de vente de billets, sans garantir leur disponibilité, leurs prix ou leurs conditions d'achat. Toutes les informations concernant les billets sont fournies par des tiers et peuvent être modifiées sans préavis. Nous vous recommandons de vérifier attentivement les conditions de vente auprès du partenaire choisi avant tout achat.
Toutes les informations sur notre portail peuvent être modifiées sans préavis. En utilisant ce portail, vous acceptez de lire le contenu à vos risques et périls.