algorithme cuTAMP : la révolution robotique du mit et de NVIDIA

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes

Des chercheurs du mit et de NVIDIA ont développé cuTAMP, un nouvel algorithme qui utilise la puissance des GPU pour la planification parallèle. Au lieu de tests lents et séquentiels, le robot analyse maintenant des milliers de mouvements possibles simultanément, résolvant des tâches complexes de manipulation et d'emballage en quelques secondes seulement.

Photo by: Domagoj Skledar/ arhiva (vlastita)

Imaginez que vous vous préparez pour des vacances longuement attendues. Vous êtes confronté au défi de faire une valise : tous les objets nécessaires doivent y rentrer sans que rien de fragile ne se brise. Pour les humains, grâce à nos capacités visuelles et spatiales, il s'agit d'un problème généralement soluble, même s'il demande un peu d'arrangement créatif. Cependant, pour un robot, cela représente une tâche de planification extrêmement complexe qui exige la prise en compte simultanée d'innombrables actions, contraintes et possibilités mécaniques. Trouver une solution efficace pourrait prendre un temps extrêmement long, si tant est que le robot parvienne à en trouver une.

Mais une équipe de scientifiques composée de chercheurs du prestigieux Massachusetts Institute of Technology (MIT) et du géant de la technologie NVIDIA a mis au point un algorithme révolutionnaire qui accélère considérablement ce processus. Leur approche innovante permet au robot de littéralement « penser à l'avance », en évaluant des milliers de plans de mouvement potentiels en parallèle, puis en affinant les meilleurs pour satisfaire toutes les conditions fixées par le robot et l'environnement. Au lieu de tester chaque action possible une par une, comme le font les méthodes existantes, cette nouvelle méthode en examine des milliers simultanément, résolvant des problèmes de manipulation complexes et multi-étapes en quelques secondes seulement.

Une révolution dans la planification : De l'approche séquentielle à l'approche parallèle

La clé de cette vitesse incroyable réside dans l'utilisation de l'immense puissance de calcul de processeurs spécialisés connus sous le nom d'unités de traitement graphique (GPU). Dans des environnements comme les usines ou les entrepôts, cette technique pourrait permettre aux robots de déterminer à la vitesse de l'éclair comment manipuler et emballer de manière dense des objets de formes et de tailles variées sans les endommager, les faire tomber ou entrer en collision avec des obstacles, même dans des espaces très restreints. Ceci est crucial dans les environnements industriels où le temps, c'est littéralement de l'argent et où il est nécessaire de trouver une solution efficace dans les plus brefs délais.

William Shen, diplômé du MIT et auteur principal de l'article scientifique sur cette technique, souligne : « Si votre algorithme met des minutes à trouver un plan, contre quelques secondes, cela coûte directement à l'entreprise. » Les algorithmes traditionnels de planification de tâches et de mouvements (TAMP) sont souvent confrontés à ce que l'on appelle une « explosion combinatoire » : le nombre de séquences d'actions possibles augmente de manière exponentielle avec chaque nouvel objet ou étape, rendant le problème presque insoluble en temps réel. La plupart de ces actions essayées au hasard ne mènent à aucun résultat productif, ce qui ralentit encore le processus.

Au cœur de l'innovation : La puissance des processeurs graphiques (GPU)

L'algorithme, nommé cuTAMP, est accéléré grâce à la plateforme de calcul parallèle CUDA, développée par NVIDIA même. Cette plateforme permet aux développeurs d'exploiter tout le potentiel des GPU pour des tâches de calcul générales, bien au-delà de leur objectif initial de génération de graphiques informatiques. Les GPU sont conçus avec des milliers de cœurs qui peuvent exécuter des opérations simultanément, ce qui les rend idéaux pour les tâches qui peuvent être divisées en de nombreuses petites parties indépendantes – exactement comme la simulation de milliers de plans différents pour un robot.

Caelan Garrett, chercheur scientifique principal chez NVIDIA Research, explique : « L'espace de recherche est énorme, et de nombreuses actions que le robot effectue dans cet espace n'accomplissent en fait rien de productif. » En utilisant un GPU, le coût de calcul de l'optimisation d'une solution devient presque identique au coût de l'optimisation de centaines ou de milliers de solutions. Il s'agit d'un changement de paradigme fondamental qui ouvre la voie à la résolution de problèmes jusqu'alors considérés comme trop complexes pour une automatisation en temps réel.

Comment « pense » cuTAMP ? Une combinaison d'échantillonnage et d'optimisation

L'équipe de recherche a conçu l'algorithme spécifiquement pour ce que l'on appelle la planification de tâches et de mouvements (TAMP). L'objectif d'un algorithme TAMP est de créer un double plan pour le robot : un plan de tâches, qui représente une séquence d'actions de haut niveau (par exemple, « prendre l'objet A », « mettre l'objet A dans la boîte »), et un plan de mouvements, qui inclut des paramètres d'action de bas niveau tels que les positions exactes des articulations du bras et l'orientation de la pince pour exécuter ce plan.

Pour créer un plan d'emballage d'objets, le robot doit réfléchir à de nombreuses variables. Celles-ci incluent l'orientation finale des objets emballés pour qu'ils s'ajustent, ainsi que la manière dont il les soulèvera et les manipulera à l'aide de son bras et de sa pince, tout en évitant les collisions et en respectant les contraintes définies par l'utilisateur, comme l'ordre d'emballage.

L'algorithme cuTAMP atteint son efficacité en combinant deux techniques puissantes : l'échantillonnage intelligent et l'optimisation parallèle.

Échantillonnage intelligent : Au lieu de choisir au hasard des solutions potentielles, cuTAMP restreint la gamme des solutions possibles à celles qui sont les plus susceptibles de satisfaire les contraintes du problème. Cette procédure d'échantillonnage modifiée permet à l'algorithme d'explorer largement les solutions potentielles, mais dans un espace restreint et prometteur. « Une fois que nous combinons les sorties de ces échantillons, nous obtenons un bien meilleur point de départ que si nous avions échantillonné au hasard. Cela garantit que nous pouvons trouver des solutions plus rapidement lors de l'optimisation », explique Shen.

Optimisation parallèle : Après avoir généré un ensemble d'échantillons, cuTAMP exécute une procédure d'optimisation parallélisée. Il calcule un « coût » pour chaque échantillon, qui correspond à la manière dont cet échantillon évite les collisions, respecte les contraintes de mouvement du robot et atteint les objectifs définis par l'utilisateur. L'algorithme met ensuite à jour tous les échantillons simultanément, sélectionne les meilleurs candidats et répète le processus jusqu'à ce qu'il les réduise à une seule solution réussie et réalisable.

Application pratique et tests : De la simulation au monde réel

Lorsque les chercheurs ont testé leur approche sur des défis d'emballage simulés de type Tetris, cuTAMP n'a eu besoin que de quelques secondes pour trouver des plans réussis et sans collision, des tâches qui prendraient beaucoup plus de temps aux approches séquentielles, si tant est qu'elles puissent les résoudre. Plus important encore, lorsqu'il a été appliqué à un bras robotique réel, l'algorithme a toujours trouvé une solution en moins de 30 secondes.

Le système est conçu pour être générique et fonctionner sur différents robots. Il a été testé avec succès sur un bras robotique au MIT et sur un robot humanoïde dans les laboratoires de NVIDIA. L'un des avantages clés est que cuTAMP n'est pas un algorithme d'apprentissage automatique et ne nécessite donc pas de données d'entraînement. Cela lui permet d'être facilement appliqué à de nombreuses nouvelles situations. « Vous pouvez lui donner un problème complètement nouveau et il est prouvé qu'il le résoudra », ajoute Garrett. Cette généralisation s'étend également à des situations au-delà de l'emballage, comme des robots utilisant des outils. Un utilisateur pourrait intégrer différents types de compétences dans le système pour étendre automatiquement les capacités du robot.

L'avenir de la manipulation autonome : Plus que de simples boîtes à empiler

Bien que l'emballage soit un excellent exemple de complexité, les applications potentielles de cette technologie sont bien plus larges. Dans la fabrication, les robots pourraient effectuer des tâches d'assemblage complexes nécessitant une manipulation précise de plusieurs composants. En logistique, ils pourraient optimiser le chargement et le déchargement des camions, en maximisant l'utilisation de l'espace. Dans les laboratoires scientifiques, ils pourraient manipuler des équipements et des échantillons sensibles, réduisant ainsi le risque d'erreur humaine.

À l'avenir, les chercheurs souhaitent exploiter les grands modèles de langage (LLM) et les modèles vision-langage au sein de cuTAMP. Cela permettrait au robot de formuler et d'exécuter un plan qui atteint des objectifs spécifiques sur la base des commandes vocales de l'utilisateur. Par exemple, vous pourriez dire au robot : « Prépare-moi mon sac de plage », et il concevrait et exécuterait de manière autonome la manière la plus efficace de l'emballer, en utilisant des capteurs visuels pour identifier des objets comme une serviette, de la crème solaire et un livre. Cette étape représente un lien crucial entre le langage humain abstrait et l'action physique concrète du robot, ouvrant la porte à une ère où les robots deviendront des partenaires encore plus intuitifs et utiles dans la vie quotidienne et au travail.

Source : Massachusetts Institute of Technology

Trouvez un hébergement à proximité

Heure de création: 06 juin, 2025

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes

Une révolution dans la planification : De l'approche séquentielle à l'approche parallèle

Au cœur de l'innovation : La puissance des processeurs graphiques (GPU)

Comment « pense » cuTAMP ? Une combinaison d'échantillonnage et d'optimisation

Application pratique et tests : De la simulation au monde réel

L'avenir de la manipulation autonome : Plus que de simples boîtes à empiler

Trouvez un hébergement à proximité

Rédaction science et technologie

Événements en Croatie

Mariana Ilkiv prépare au Lisinski un concert caritatif qui apporte à Zagreb une soirée de culture ukrainienne et de solidarité

Poreč sous le signe du cyclisme : Nexetis a triomphé chez les cyclistes féminines, Viggo Moore a remporté le Poreč Classic et le final

Aminess a mis en avant la force de ses salariées pour la Journée des femmes : les femmes occupent plus de la moitié des postes de direction dans l’entreprise

Le Festival des Lumières de Zagreb 2026 apporte des installations artistiques, des messages sur la nature et un nouveau rythme printanier à la ville

Poreč au centre de l'Istrian Spring : après le Poreč Classic suit la grande finale de la course par étapes à travers l'Istrie

Baške Oštarije Trail 2026 sur le Velebit : Karlobag et le défi de montagne apportent trois courses et un spectacle sportif

Opatija, le 7 mars 2026 au rythme de la santé : marche nordique gratuite et Thalasso Cardio Walk sur le Lungomare

Wine ViP Event jubilaire à Zadar : formation et expérience œno-gastro à l’hôtel A’Mare avec une note caritative

Un algorithme révolutionnaire cuTAMP du mit et de NVIDIA permet aux robots de résoudre des tâches complexes en quelques secondes

Une révolution dans la planification : De l'approche séquentielle à l'approche parallèle

Au cœur de l'innovation : La puissance des processeurs graphiques (GPU)

Comment « pense » cuTAMP ? Une combinaison d'échantillonnage et d'optimisation

Application pratique et tests : De la simulation au monde réel

L'avenir de la manipulation autonome : Plus que de simples boîtes à empiler

Trouvez un hébergement à proximité

Relié