Escala con IA
Posts
NVIDIA y Stanford crean dibujos animados con IA ¡de un minuto!

NVIDIA y Stanford crean dibujos animados con IA ¡de un minuto!

ADEMÁS: Amazon lanza nuevo modelo de voz y mejora de vídeo.

Marco Chávez
9 de abril de 2025

¡Muy buenos días, gente curiosa de Escala con IA! ¿Se acuerdan de esos videos generados por IA que duraban un suspiro y no tenían ni pies ni cabeza? Parecía que la IA tenía déficit de atención a la hora de contar historias... ¡Pues agárrense! Una nueva investigación de NVIDIA y Stanford podría cambiar las reglas del juego.

Utilizando un método novedoso y, ojo al dato, un montón de dibujos animados de Tom y Jerry (¡sí, esos!), han conseguido crear videos coherentes ¡de un minuto entero! Parece que los días de los clips cortos y sin sentido están llegando a su fin. ¿Listos para ver cómo la IA aprende a narrar?

📰 En el boletín de hoy:

🎬 NVIDIA y Stanford: ¡dibujos animados IA de un minuto!
🗣️ Amazon: nuevo modelo de voz y mejoras en vídeo.
🧠 Thinking Machines de Murati ficha más talento ex-OpenAI.
📰 Todo lo demás sobre IA hoy (en titulares).

ÚLTIMAS NOTICIAS DE IA

NVIDIA y Stanford

NVIDIA y Stanford: dibujos animados con IA que (¡por fin!) duran un minuto

Fuente: NVIDIA and Stanford University

Escala con IA: ¿Recuerdas cuando los vídeos de IA duraban menos que un suspiro y la coherencia brillaba por su ausencia? Pues parece que eso está cambiando. Resulta que investigadores de NVIDIA y Stanford acaban de presentar una técnica llamada 'Test-Time Training'. ¿Y qué hace esta maravilla? Pues permite generar vídeos bastante más largos de lo que estábamos acostumbrados. Ya han mostrado demos con clips de dibujos animados de un minuto, ¡y con mejor coherencia y narrativa! Como si Tom y Jerry hubieran fichado a una IA para sus próximos episodios.

Detalles:

El sistema puede crear animaciones completas de un minuto manteniendo la coherencia entre escenas. Dicen que supera con creces a los métodos actuales, según las evaluaciones humanas (vamos, que a la gente le ha molado más).
Las capas TTT (así las llaman) funcionan usando redes neuronales como si fueran memoria. Esto le permite al modelo 'recordar' lo que pasó antes y mantener la coherencia en secuencias mucho más largas. ¡Se acabaron los personajes que cambian de ropa en cada fotograma!
Para demostrarlo, el equipo usó dibujos de Tom y Jerry (¡un clásico!), mostrando historias con varias escenas, movimiento dinámico y las típicas interacciones entre ellos.
Lo interesante es que este enfoque modifica modelos de vídeo que ya existen. Les añaden estas capas TTT y ¡listo!, pueden manejar vídeos mucho más largos de lo que podían originalmente.

Por qué es importante: A ver, el vídeo con IA ha mejorado una barbaridad en el último año, ¿verdad? Pero uno de los grandes 'peros' sigue siendo la duración de los clips y que todo tenga sentido de una toma a otra (la famosa coherencia). Este nuevo método podría ser la llave para, por fin, contar historias más largas y lógicas sin tener que pegar cientos de pedacitos generados por separado. Imagínate, ¡películas enteras creadas por IA sin que parezcan un collage!

NVIDIA y Stanford

Amazon sube la apuesta: nuevo modelo de voz y mejoras en video IA

Fuente: AWS

Escala con IA: ¿Harto de que las voces de IA suenen más robóticas que tu cafetera vieja? Parece que Amazon también, porque acaba de lanzar Nova Sonic, un nuevo modelo de voz que promete interacciones súper humanas. Y como si fuera poco, también le dieron una manita de gato a su modelo de video Nova Reels 1.1, mejorando calidad y duración. ¡Doble combo!

Detalles:

Nova Sonic procesa la voz y genera habla natural con una latency (vamos, el retraso) de solo 1.09 segundos. Bastante más rápido que los modelos de voz de OpenAI, ¿eh?
Consiguió una tasa de error por palabra (word error rate) del 4.2% en varios idiomas y demostró ser un 46.7% más preciso que GPT-4o en entornos ruidosos y con varias personas hablando a la vez (como en las cenas familiares, seguro).
Reels 1.1 ahora permite crear videos de hasta 2 minutos, ya sea de forma automática o manual, permitiéndote montar tu contenido toma por toma o con un simple prompt.
Ambos modelos están disponibles a través de Amazon Bedrock, y ojo al dato: Nova Sonic cuesta aproximadamente un 80% menos que las opciones comparables de OpenAI. ¡Auch!

Por qué es importante: Este doble golpe de Amazon en voz y video demuestra que el gigante del retail se está poniendo las pilas en serio en la carrera de la IA generativa. Con su herramienta de navegador agentic llamada Act, la IA integrada en Alexa+ y otros esfuerzos, Amazon está tentando cada vez más a los desarrolladores para que le echen un ojo a su stack de IA, plantando cara a competidores más populares. La cosa se pone interesante.

Thinking Machines

Mira Murati sigue 'pescando' talento ex-OpenAI para Thinking Machines

Fuente: Thinking Machines

Escala con IA: Oye, ¿te acuerdas de Thinking Machines Lab, la startup de IA que montó Mira Murati, la antigua CTO de OpenAI? Pues <a href="https://techcrunch.com/2025/04/08/mira-muratis-ai-startup-gains-prominent-ex-openai-advisers/" target="_blank">acaban de fichar</a> como asesores a Bob McGrew (ex CRO de OpenAI) y Alec Radford (uno de los arquitectos de GPT). Con esto, casi la mitad de su equipo ya viene de OpenAI. ¡Vaya reunión de ex-compañeros!

Detalles:

De los 38 miembros del '<a href="https://thinkingmachines.ai/" target="_blank">Equipo Fundador</a>' que aparecen listados, 19 trabajaron antes en OpenAI. ¡Ojo!, que ahí está hasta John Schulman, cofundador de OpenAI, como científico jefe.
McGrew se fue de OpenAI en septiembre después de ocho años, y se une a Murati solo unos meses después de anunciar que se tomaba un respiro del sector. Parece que el descanso no duró mucho, ¿eh?
Radford fue clave en la creación de la tecnología GPT de OpenAI y dejó la compañía el año pasado para investigar por su cuenta. Ahora parece que vuelve al ruedo, al menos como asesor.
Se <a href="https://www.businessinsider.com/mira-murati-new-startup-thinking-machine-labs-valuation-2025-2" target="_blank">rumorea</a> que la startup buscaba levantar hasta 1.000 millones de dólares con una valoración de 9.000 millones. Una pasta gansa, aunque todavía no sabemos muy bien qué van a sacar o cuáles son sus planes. Mucho secretismo.

Por qué es importante: Murati sigue reuniendo a sus antiguos colegas, ¡y no a cualquiera! Estamos hablando de muchas de las mentes detrás de ChatGPT, DALL-E y otros avances top en IA. Y piensa que, con toda la competencia que ya hay dando caña en el mundo de la IA, todavía tenemos a estas dos "tapadas": las startups de Murati y la de Ilya Sutskever (SSI), ambas lideradas por pesos pesados de OpenAI, esperando su momento para saltar al escenario. ¡Esto se pone interesante!

Más Noticias de IA

El resto de noticias sobre IA de hoy

NVIDIA lanzó Nemotron-Ultra, un modelo de razonamiento open-source de 253 mil millones de parámetros que supera a DeepSeek R1 y Llama 4 Behemoth en benchmarks clave.

OpenAI publicó su Plan Económico para la UE, proponiendo un fondo acelerador de IA de 1.000 millones de euros y con el objetivo de formar a 100 millones de europeos en habilidades de IA para 2030.

Deep Cogito salió de la sombra con Cogito v1 Preview, una familia de modelos open-source que, según afirman, supera a los mejores modelos abiertos disponibles del mismo tamaño.

Google desplegó su función Deep Research en Gemini 2.5 Pro, afirmando generar informes de investigación superiores a los de la competencia y añadiendo nuevas capacidades de resumen por audio.

Científicos chinos utilizaron el ordenador cuántico Origin Wukong para ajustar (finetune) modelos de 1.000 millones de parámetros, logrando mejoras del 15% en el entrenamiento y una reducción del 76% en el tamaño del modelo.

AI2 y Google Cloud anunciaron una inversión conjunta de 20 millones de dólares para impulsar y acelerar avances contra el cáncer mediante IA con la plataforma de investigación de la Cancer AI Alliance.

Snapchat estrenó los Sponsored AI Lenses para marcas, utilizando publicidad potenciada por IA para transformar a los usuarios en momentos personales de marca.

¡Y eso es todo por hoy en nuestro resumen IA!

NVIDIA y Stanford nos dejan boquiabiertos con sus avances en vídeo, mientras Amazon no se queda atrás mejorando voz y vídeo. Además, Thinking Machines sigue armando su 'dream team' con ex-OpenAI y, como siempre, un montón de noticias rápidas. ¡Esto no para!

¡Espero que tengas un día genial y lleno de descubrimientos! ¡Nos leemos en la próxima edición de Escala con IA!

Mark, Parte del equipo de Escala con IA.