Postavke privatnosti

Un revolucionario algoritmo cuTAMP del MIT y NVIDIA permite a los robots resolver tareas complejas en segundos

Investigadores del MIT y NVIDIA han desarrollado cuTAMP, un nuevo algoritmo que utiliza el poder de las GPU para la planificación paralela. En lugar de realizar pruebas secuenciales lentas, el robot ahora analiza miles de posibles movimientos simultáneamente, resolviendo tareas complejas de manipulación y empaquetado en solo segundos.

Un revolucionario algoritmo cuTAMP del MIT y NVIDIA permite a los robots resolver tareas complejas en segundos
Photo by: Domagoj Skledar/ arhiva (vlastita)

Imagine que se está preparando para unas vacaciones muy esperadas. Se enfrenta al desafío de hacer una maleta: todas las cosas necesarias deben caber sin que nada frágil se rompa. Para los humanos, gracias a nuestras habilidades visuales y espaciales, este es un problema mayormente solucionable, incluso si requiere un poco de arreglo creativo. Sin embargo, para un robot, esto representa una tarea de planificación extremadamente compleja que requiere la consideración simultánea de innumerables acciones, restricciones y posibilidades mecánicas. Encontrar una solución eficaz podría llevar muchísimo tiempo, si es que el robot logra encontrarla.


Pero un equipo científico compuesto por investigadores del prestigioso Instituto de Tecnología de Massachusetts (MIT) y el gigante tecnológico NVIDIA ha desarrollado un algoritmo revolucionario que acelera drásticamente este proceso. Su enfoque innovador permite al robot literalmente "pensar con antelación", evaluando miles de planes de movimiento potenciales en paralelo y luego refinando los mejores para satisfacer todas las condiciones establecidas del robot y del entorno. En lugar de probar cada acción posible una por una, como los métodos existentes, este nuevo método considera miles de ellas simultáneamente, resolviendo problemas de manipulación complejos y de múltiples fases en solo unos segundos.


Revolución en la planificación: Del enfoque secuencial al paralelo


La clave de esta increíble velocidad reside en el uso de la inmensa potencia de cálculo de procesadores especializados conocidos como unidades de procesamiento gráfico (GPU). En entornos como fábricas o almacenes, esta técnica podría permitir a los robots determinar a la velocidad del rayo cómo manipular y empaquetar densamente objetos de diversas formas y tamaños sin dañarlos, derrumbarlos o chocar con obstáculos, incluso en espacios muy reducidos. Esto es crucial en entornos industriales donde el tiempo es literalmente dinero y donde es necesario encontrar una solución eficiente en el menor tiempo posible.


William Shen, graduado del MIT y autor principal del artículo científico sobre esta técnica, señala: "Si a su algoritmo le toma minutos encontrar un plan, en lugar de segundos, eso le cuesta directamente a la empresa". Los algoritmos tradicionales de Planificación de Tareas y Movimientos (TAMP) a menudo se enfrentan a lo que se denomina una "explosión combinatoria": el número de posibles secuencias de acciones crece exponencialmente con cada nuevo objeto o paso, lo que hace que el problema sea casi irresoluble en tiempo real. La mayoría de estas acciones probadas al azar no conducen a ningún resultado productivo, lo que ralentiza aún más el proceso.


En el corazón de la innovación: El poder de las unidades de procesamiento gráfico (GPU)


El algoritmo, llamado cuTAMP, se acelera utilizando la plataforma de computación paralela CUDA, desarrollada por la propia NVIDIA. Esta plataforma permite a los programadores aprovechar todo el potencial de las GPU para tareas de computación de propósito general, mucho más allá de su propósito original de generar gráficos por computadora. Las GPU están diseñadas con miles de núcleos que pueden ejecutar operaciones simultáneamente, lo que las hace ideales para tareas que se pueden dividir en muchas partes más pequeñas e independientes, exactamente como simular miles de planes diferentes para un robot.


Caelan Garrett, científico investigador sénior en NVIDIA Research, explica: "El espacio de búsqueda es enorme, y muchas de las acciones que el robot realiza en ese espacio en realidad no logran nada productivo". Al utilizar una GPU, el costo computacional de optimizar una solución se vuelve casi idéntico al costo de optimizar cientos o miles de soluciones. Este es un cambio de paradigma fundamental que abre la puerta a la resolución de problemas que hasta ahora se consideraban demasiado complejos para la automatización en tiempo real.


¿Cómo "piensa" cuTAMP? Combinación de muestreo y optimización


El equipo de investigación diseñó el algoritmo específicamente para lo que se llama planificación de tareas y movimientos (TAMP). El objetivo de un algoritmo TAMP es crear un plan doble para el robot: un plan de tareas, que representa una secuencia de acciones de alto nivel (por ejemplo, "recoger objeto A", "colocar objeto A en la caja"), y un plan de movimientos, que incluye parámetros de acción de bajo nivel como las posiciones exactas de las articulaciones del brazo y la orientación de la pinza para ejecutar ese plan.


Para crear un plan para empaquetar objetos, el robot debe pensar en numerosas variables. Esto incluye la orientación final de los objetos empaquetados para que quepan, así como la forma en que los levantará y manipulará usando su brazo y pinza, todo ello evitando colisiones y respetando las restricciones definidas por el usuario, como el orden de empaquetado.


El algoritmo cuTAMP logra su eficiencia combinando dos técnicas poderosas: muestreo inteligente y optimización paralela.


Muestreo inteligente: En lugar de elegir al azar soluciones potenciales, cuTAMP restringe el rango de soluciones posibles a aquellas que tienen más probabilidades de satisfacer las restricciones del problema. Este procedimiento de muestreo modificado permite que el algoritmo explore ampliamente las soluciones potenciales, pero dentro de un espacio prometedor y más reducido. "Una vez que combinamos los resultados de estas muestras, obtenemos un punto de partida mucho mejor que si hubiéramos muestreado al azar. Esto asegura que podamos encontrar soluciones más rápidamente durante la optimización", explica Shen.


Optimización paralela: Después de generar un conjunto de muestras, cuTAMP lleva a cabo un procedimiento de optimización paralelizado. Calcula un "costo" para cada muestra, que corresponde a qué tan bien esa muestra evita colisiones, cumple con las restricciones de movimiento del robot y satisface los objetivos definidos por el usuario. Luego, el algoritmo actualiza todas las muestras simultáneamente, selecciona los mejores candidatos y repite el proceso hasta reducirlos a una única solución exitosa y factible.


Aplicación práctica y pruebas: De la simulación al mundo real


Cuando los investigadores probaron su enfoque en desafíos de empaquetado simulados similares a Tetris, a cuTAMP le tomó solo unos segundos encontrar planes exitosos y sin colisiones, tareas que a los enfoques secuenciales les llevaría mucho más tiempo, si es que lograban resolverlas. Más importante aún, cuando se aplicó a un brazo robótico real, el algoritmo siempre encontró una solución en menos de 30 segundos.


El sistema está diseñado para ser general y funcionar en diferentes robots. Ha sido probado con éxito en un brazo robótico en el MIT y en un robot humanoide en los laboratorios de NVIDIA. Una de las ventajas clave es que cuTAMP no es un algoritmo de aprendizaje automático y, por lo tanto, no requiere datos de entrenamiento. Esto le permite aplicarse fácilmente en muchas situaciones nuevas. "Puedes darle un problema completamente nuevo y está demostrado que lo resolverá", agrega Garrett. Esta generalización también se extiende a situaciones más allá del empaquetado, como robots que usan herramientas. Un usuario podría incorporar diferentes tipos de habilidades en el sistema para ampliar automáticamente las capacidades del robot.


El futuro de la manipulación autónoma: Más que apilar cajas


Aunque el empaquetado es un excelente ejemplo de complejidad, las aplicaciones potenciales de esta tecnología son mucho más amplias. En la fabricación, los robots podrían realizar tareas de ensamblaje complejas que requieren una manipulación precisa de múltiples componentes. En logística, podrían optimizar la carga y descarga de camiones, aprovechando al máximo el espacio. En los laboratorios científicos, podrían manipular equipos y muestras sensibles, reduciendo el riesgo de error humano.


En el futuro, los investigadores quieren aprovechar los grandes modelos de lenguaje (LLM) y los modelos de visión y lenguaje dentro de cuTAMP. Esto permitiría al robot formular y ejecutar un plan que logre objetivos específicos basados en los comandos de voz del usuario. Por ejemplo, podrías decirle al robot: "Prepárame la bolsa de playa", y él, utilizando sensores visuales para identificar objetos como una toalla, protector solar y un libro, idearía y llevaría a cabo de forma autónoma la forma más eficiente de empaquetarlos. Este paso representa un vínculo crucial entre el lenguaje humano abstracto y la acción física concreta del robot, abriendo la puerta a una era en la que los robots se convertirán en socios aún más intuitivos y útiles en la vida y el trabajo cotidianos.

Fuente: Massachusetts Institute of Technology

Encuentra alojamiento cerca

Hora de creación: 06 junio, 2025

Redacción de ciencia y tecnología

Nuestra Redacción de Ciencia y Tecnología nació de una pasión de muchos años por investigar, interpretar y acercar temas complejos a los lectores comunes. En ella escriben empleados y voluntarios que llevan décadas siguiendo el desarrollo de la ciencia y la innovación tecnológica, desde descubrimientos de laboratorio hasta soluciones que transforman la vida cotidiana. Aunque escribimos en plural, detrás de cada texto hay una persona real con amplia experiencia editorial y periodística, y un profundo respeto por los hechos y la información verificable.

Nuestra redacción fundamenta su trabajo en la convicción de que la ciencia es más fuerte cuando es accesible para todos. Por eso buscamos claridad, precisión y comprensión, sin simplificaciones que puedan perjudicar la calidad del contenido. A menudo pasamos horas estudiando investigaciones, documentos técnicos y fuentes especializadas para presentar cada tema de una forma que interese al lector sin sobrecargarlo. En cada artículo intentamos conectar el conocimiento científico con la vida real, mostrando cómo las ideas surgidas de centros de investigación, universidades y laboratorios tecnológicos moldean el mundo que nos rodea.

Nuestra larga experiencia periodística nos permite reconocer lo que realmente importa al lector, ya se trate de avances en inteligencia artificial, descubrimientos médicos, soluciones energéticas, misiones espaciales o dispositivos que entran en nuestra vida cotidiana antes de que podamos imaginar sus posibilidades. Nuestra mirada sobre la tecnología no es solo técnica; también nos interesan las historias humanas detrás de los grandes avances: investigadores que trabajan durante años para completar proyectos, ingenieros que convierten ideas en sistemas funcionales y visionarios que amplían los límites de lo posible.

En nuestro trabajo también nos guía un fuerte sentido de responsabilidad. Queremos que el lector pueda confiar en la información que ofrecemos, por lo que verificamos fuentes, comparamos datos y no publicamos con prisa cuando algo no está completamente claro. La confianza se construye más lentamente de lo que se escribe una noticia, pero creemos que solo este tipo de periodismo tiene un valor duradero.

Para nosotros, la tecnología es más que dispositivos y la ciencia más que teoría. Son campos que impulsan el progreso, moldean la sociedad y ofrecen nuevas oportunidades a quienes desean comprender cómo funciona el mundo hoy y hacia dónde se dirige mañana. Por eso abordamos cada tema con seriedad, pero también con curiosidad, porque la curiosidad abre la puerta a los mejores textos.

Nuestra misión es acercar a los lectores a un mundo que cambia más rápido que nunca, con la convicción de que el periodismo de calidad puede ser un puente entre expertos, innovadores y todos aquellos que desean entender lo que ocurre detrás de los titulares. En esto vemos nuestra verdadera tarea: convertir lo complejo en comprensible, lo lejano en cercano y lo desconocido en inspirador.

AVISO PARA NUESTROS LECTORES
Karlobag.eu ofrece noticias, análisis e información sobre eventos globales y temas de interés para lectores de todo el mundo. Toda la información publicada se ofrece únicamente con fines informativos.
Destacamos que no somos expertos en los ámbitos científico, médico, financiero ni legal. Por lo tanto, antes de tomar decisiones basadas en la información de nuestro portal, le recomendamos que consulte a expertos cualificados.
Karlobag.eu puede contener enlaces a sitios externos de terceros, incluidos enlaces de afiliados y contenidos patrocinados. Si compra un producto o servicio a través de estos enlaces, podemos recibir una comisión. No tenemos control sobre el contenido o las políticas de dichos sitios y no asumimos responsabilidad alguna por su exactitud, disponibilidad o por cualquier transacción realizada a través de ellos.
Si publicamos información sobre eventos o venta de entradas, tenga en cuenta que no vendemos entradas ni directamente ni a través de intermediarios. Nuestro portal informa únicamente a los lectores sobre eventos y oportunidades de compra a través de plataformas de venta externas. Conectamos a los lectores con socios que ofrecen servicios de venta de entradas, pero no garantizamos su disponibilidad, precios o condiciones de compra. Toda la información sobre las entradas es obtenida de terceros y puede estar sujeta a cambios sin previo aviso. Le recomendamos que verifique detenidamente las condiciones de venta con el socio seleccionado antes de realizar cualquier compra.
Toda la información en nuestro portal está sujeta a cambios sin previo aviso. Al utilizar este portal, usted acepta leer el contenido bajo su propio riesgo.