Postavke privatnosti

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes

Des chercheurs du mit et de NVIDIA ont développé cuTAMP, un nouvel algorithme qui utilise la puissance des GPU pour la planification parallèle. Au lieu de tests lents et séquentiels, le robot analyse maintenant des milliers de mouvements possibles simultanément, résolvant des tâches complexes de manipulation et d'emballage en quelques secondes seulement.

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes
Photo by: Domagoj Skledar/ arhiva (vlastita)

Imaginez que vous vous préparez pour des vacances longuement attendues. Vous êtes confronté au défi de faire une valise : tous les objets nécessaires doivent y rentrer sans que rien de fragile ne se brise. Pour les humains, grâce à nos capacités visuelles et spatiales, il s'agit d'un problème généralement soluble, même s'il demande un peu d'arrangement créatif. Cependant, pour un robot, cela représente une tâche de planification extrêmement complexe qui exige la prise en compte simultanée d'innombrables actions, contraintes et possibilités mécaniques. Trouver une solution efficace pourrait prendre un temps extrêmement long, si tant est que le robot parvienne à en trouver une.


Mais une équipe de scientifiques composée de chercheurs du prestigieux Massachusetts Institute of Technology (MIT) et du géant de la technologie NVIDIA a mis au point un algorithme révolutionnaire qui accélère considérablement ce processus. Leur approche innovante permet au robot de littéralement « penser à l'avance », en évaluant des milliers de plans de mouvement potentiels en parallèle, puis en affinant les meilleurs pour satisfaire toutes les conditions fixées par le robot et l'environnement. Au lieu de tester chaque action possible une par une, comme le font les méthodes existantes, cette nouvelle méthode en examine des milliers simultanément, résolvant des problèmes de manipulation complexes et multi-étapes en quelques secondes seulement.


Une révolution dans la planification : De l'approche séquentielle à l'approche parallèle


La clé de cette vitesse incroyable réside dans l'utilisation de l'immense puissance de calcul de processeurs spécialisés connus sous le nom d'unités de traitement graphique (GPU). Dans des environnements comme les usines ou les entrepôts, cette technique pourrait permettre aux robots de déterminer à la vitesse de l'éclair comment manipuler et emballer de manière dense des objets de formes et de tailles variées sans les endommager, les faire tomber ou entrer en collision avec des obstacles, même dans des espaces très restreints. Ceci est crucial dans les environnements industriels où le temps, c'est littéralement de l'argent et où il est nécessaire de trouver une solution efficace dans les plus brefs délais.


William Shen, diplômé du MIT et auteur principal de l'article scientifique sur cette technique, souligne : « Si votre algorithme met des minutes à trouver un plan, contre quelques secondes, cela coûte directement à l'entreprise. » Les algorithmes traditionnels de planification de tâches et de mouvements (TAMP) sont souvent confrontés à ce que l'on appelle une « explosion combinatoire » : le nombre de séquences d'actions possibles augmente de manière exponentielle avec chaque nouvel objet ou étape, rendant le problème presque insoluble en temps réel. La plupart de ces actions essayées au hasard ne mènent à aucun résultat productif, ce qui ralentit encore le processus.


Au cœur de l'innovation : La puissance des processeurs graphiques (GPU)


L'algorithme, nommé cuTAMP, est accéléré grâce à la plateforme de calcul parallèle CUDA, développée par NVIDIA même. Cette plateforme permet aux développeurs d'exploiter tout le potentiel des GPU pour des tâches de calcul générales, bien au-delà de leur objectif initial de génération de graphiques informatiques. Les GPU sont conçus avec des milliers de cœurs qui peuvent exécuter des opérations simultanément, ce qui les rend idéaux pour les tâches qui peuvent être divisées en de nombreuses petites parties indépendantes – exactement comme la simulation de milliers de plans différents pour un robot.


Caelan Garrett, chercheur scientifique principal chez NVIDIA Research, explique : « L'espace de recherche est énorme, et de nombreuses actions que le robot effectue dans cet espace n'accomplissent en fait rien de productif. » En utilisant un GPU, le coût de calcul de l'optimisation d'une solution devient presque identique au coût de l'optimisation de centaines ou de milliers de solutions. Il s'agit d'un changement de paradigme fondamental qui ouvre la voie à la résolution de problèmes jusqu'alors considérés comme trop complexes pour une automatisation en temps réel.


Comment « pense » cuTAMP ? Une combinaison d'échantillonnage et d'optimisation


L'équipe de recherche a conçu l'algorithme spécifiquement pour ce que l'on appelle la planification de tâches et de mouvements (TAMP). L'objectif d'un algorithme TAMP est de créer un double plan pour le robot : un plan de tâches, qui représente une séquence d'actions de haut niveau (par exemple, « prendre l'objet A », « mettre l'objet A dans la boîte »), et un plan de mouvements, qui inclut des paramètres d'action de bas niveau tels que les positions exactes des articulations du bras et l'orientation de la pince pour exécuter ce plan.


Pour créer un plan d'emballage d'objets, le robot doit réfléchir à de nombreuses variables. Celles-ci incluent l'orientation finale des objets emballés pour qu'ils s'ajustent, ainsi que la manière dont il les soulèvera et les manipulera à l'aide de son bras et de sa pince, tout en évitant les collisions et en respectant les contraintes définies par l'utilisateur, comme l'ordre d'emballage.


L'algorithme cuTAMP atteint son efficacité en combinant deux techniques puissantes : l'échantillonnage intelligent et l'optimisation parallèle.


Échantillonnage intelligent : Au lieu de choisir au hasard des solutions potentielles, cuTAMP restreint la gamme des solutions possibles à celles qui sont les plus susceptibles de satisfaire les contraintes du problème. Cette procédure d'échantillonnage modifiée permet à l'algorithme d'explorer largement les solutions potentielles, mais dans un espace restreint et prometteur. « Une fois que nous combinons les sorties de ces échantillons, nous obtenons un bien meilleur point de départ que si nous avions échantillonné au hasard. Cela garantit que nous pouvons trouver des solutions plus rapidement lors de l'optimisation », explique Shen.


Optimisation parallèle : Après avoir généré un ensemble d'échantillons, cuTAMP exécute une procédure d'optimisation parallélisée. Il calcule un « coût » pour chaque échantillon, qui correspond à la manière dont cet échantillon évite les collisions, respecte les contraintes de mouvement du robot et atteint les objectifs définis par l'utilisateur. L'algorithme met ensuite à jour tous les échantillons simultanément, sélectionne les meilleurs candidats et répète le processus jusqu'à ce qu'il les réduise à une seule solution réussie et réalisable.


Application pratique et tests : De la simulation au monde réel


Lorsque les chercheurs ont testé leur approche sur des défis d'emballage simulés de type Tetris, cuTAMP n'a eu besoin que de quelques secondes pour trouver des plans réussis et sans collision, des tâches qui prendraient beaucoup plus de temps aux approches séquentielles, si tant est qu'elles puissent les résoudre. Plus important encore, lorsqu'il a été appliqué à un bras robotique réel, l'algorithme a toujours trouvé une solution en moins de 30 secondes.


Le système est conçu pour être générique et fonctionner sur différents robots. Il a été testé avec succès sur un bras robotique au MIT et sur un robot humanoïde dans les laboratoires de NVIDIA. L'un des avantages clés est que cuTAMP n'est pas un algorithme d'apprentissage automatique et ne nécessite donc pas de données d'entraînement. Cela lui permet d'être facilement appliqué à de nombreuses nouvelles situations. « Vous pouvez lui donner un problème complètement nouveau et il est prouvé qu'il le résoudra », ajoute Garrett. Cette généralisation s'étend également à des situations au-delà de l'emballage, comme des robots utilisant des outils. Un utilisateur pourrait intégrer différents types de compétences dans le système pour étendre automatiquement les capacités du robot.


L'avenir de la manipulation autonome : Plus que de simples boîtes à empiler


Bien que l'emballage soit un excellent exemple de complexité, les applications potentielles de cette technologie sont bien plus larges. Dans la fabrication, les robots pourraient effectuer des tâches d'assemblage complexes nécessitant une manipulation précise de plusieurs composants. En logistique, ils pourraient optimiser le chargement et le déchargement des camions, en maximisant l'utilisation de l'espace. Dans les laboratoires scientifiques, ils pourraient manipuler des équipements et des échantillons sensibles, réduisant ainsi le risque d'erreur humaine.


À l'avenir, les chercheurs souhaitent exploiter les grands modèles de langage (LLM) et les modèles vision-langage au sein de cuTAMP. Cela permettrait au robot de formuler et d'exécuter un plan qui atteint des objectifs spécifiques sur la base des commandes vocales de l'utilisateur. Par exemple, vous pourriez dire au robot : « Prépare-moi mon sac de plage », et il concevrait et exécuterait de manière autonome la manière la plus efficace de l'emballer, en utilisant des capteurs visuels pour identifier des objets comme une serviette, de la crème solaire et un livre. Cette étape représente un lien crucial entre le langage humain abstrait et l'action physique concrète du robot, ouvrant la porte à une ère où les robots deviendront des partenaires encore plus intuitifs et utiles dans la vie quotidienne et au travail.

Source : Massachusetts Institute of Technology

Trouvez un hébergement à proximité

Heure de création: 06 juin, 2025

Rédaction science et technologie

Notre Rédaction Science et Technologie est née d’une passion de longue date pour l’exploration, l’interprétation et la vulgarisation de sujets complexes auprès du grand public. Elle réunit des salariés et des bénévoles qui suivent depuis des décennies l’évolution de la science et de l’innovation technologique, des découvertes en laboratoire aux solutions qui transforment la vie quotidienne. Bien que nous écrivions au pluriel, chaque texte est rédigé par une personne réelle dotée d’une vaste expérience éditoriale et journalistique, ainsi que d’un profond respect pour les faits et les informations vérifiables.

Notre rédaction fonde son travail sur la conviction que la science est plus forte lorsqu’elle est accessible à tous. C’est pourquoi nous recherchons la clarté, la précision et la lisibilité, sans simplifications qui nuiraient à la qualité du contenu. Nous passons souvent des heures à étudier des recherches, des documents techniques et des sources spécialisées afin de présenter chaque sujet de manière à susciter l’intérêt du lecteur plutôt qu’à le surcharger. Dans chaque article, nous nous efforçons de relier les connaissances scientifiques à la vie réelle, en montrant comment les idées issues des centres de recherche, des universités et des laboratoires technologiques façonnent le monde qui nous entoure.

Notre longue expérience journalistique nous permet d’identifier ce qui est réellement important pour le lecteur, qu’il s’agisse de progrès dans l’intelligence artificielle, de découvertes médicales, de solutions énergétiques, de missions spatiales ou d’appareils qui entrent dans notre quotidien avant même que nous en imaginions les possibilités. Notre regard sur la technologie n’est pas uniquement technique ; nous nous intéressons aussi aux histoires humaines derrière les grandes avancées – chercheurs qui passent des années sur leurs projets, ingénieurs qui transforment des idées en systèmes fonctionnels, visionnaires qui repoussent les frontières du possible.

Un fort sentiment de responsabilité guide également notre travail. Nous voulons que le lecteur puisse avoir confiance dans les informations que nous fournissons, c’est pourquoi nous vérifions les sources, comparons les données et retardons la publication si un élément reste incertain. La confiance se construit plus lentement qu’une actualité ne s’écrit, mais nous croyons que seul un journalisme de cette rigueur a une valeur durable.

Pour nous, la technologie est plus qu’un ensemble d’appareils, et la science plus qu’une théorie. Ce sont des domaines qui stimulent le progrès, façonnent la société et offrent de nouvelles possibilités à tous ceux qui souhaitent comprendre comment le monde fonctionne aujourd’hui et où il se dirige demain. C’est pourquoi nous abordons chaque sujet avec sérieux mais aussi curiosité, car la curiosité est la porte d’entrée des meilleurs textes.

Notre mission est de rapprocher les lecteurs d’un monde qui change plus vite que jamais, avec la conviction qu’un journalisme de qualité peut servir de pont entre experts, innovateurs et tous ceux qui veulent comprendre ce qui se passe derrière les titres. Nous voyons là notre véritable tâche : transformer le complexe en compréhensible, le lointain en proche et l’inconnu en source d’inspiration.

AVIS À NOS LECTEURS
Karlobag.eu fournit des actualités, des analyses et des informations sur les événements mondiaux et les sujets d'intérêt pour les lecteurs du monde entier. Toutes les informations publiées sont fournies à titre informatif uniquement.
Nous soulignons que nous ne sommes pas des experts dans les domaines scientifique, médical, financier ou juridique. Par conséquent, avant de prendre toute décision basée sur les informations de notre portail, nous vous recommandons de consulter des experts qualifiés.
Karlobag.eu peut contenir des liens vers des sites externes de tiers, y compris des liens affiliés et des contenus sponsorisés. Si vous achetez un produit ou un service via ces liens, nous pouvons percevoir une commission. Nous n'avons aucun contrôle sur le contenu ou les politiques de ces sites et déclinons toute responsabilité quant à leur exactitude, leur disponibilité ou toute transaction effectuée via ces liens.
Si nous publions des informations sur des événements ou des ventes de billets, veuillez noter que nous ne vendons pas de billets, ni directement ni par l'intermédiaire. Notre portail informe uniquement les lecteurs des événements et des possibilités d'achat via des plateformes de vente externes. Nous mettons en relation les lecteurs avec des partenaires offrant des services de vente de billets, sans garantir leur disponibilité, leurs prix ou leurs conditions d'achat. Toutes les informations concernant les billets sont fournies par des tiers et peuvent être modifiées sans préavis. Nous vous recommandons de vérifier attentivement les conditions de vente auprès du partenaire choisi avant tout achat.
Toutes les informations sur notre portail peuvent être modifiées sans préavis. En utilisant ce portail, vous acceptez de lire le contenu à vos risques et périls.