Escala con IA
Posts
El nuevo modo de voz de Anthropic para Claude.

El nuevo modo de voz de Anthropic para Claude.

ADEMÁS: La startup de IA del cofundador de Synthesia crea mundos 3D.

Marco Chávez
28 de mayo de 2025

¡Muy buenos días, gente de Escala con IA! Prepárense para una noticia que va a dar mucho de qué hablar: ¡Anthropic, el último gran gigante de la IA, acaba de unirse al movimiento de la voz! Finalmente, su asistente puede hablar. Como siempre con Anthropic, más vale tarde que nunca, y con el lanzamiento de nuevos modelos y ahora esta nueva voz, ¡el gigante de la IA vuelve a la carga!.

Esto es lo que debes saber acerca de AI:

El nuevo modo de voz de Claude de Anthropic
La startup de IA de un cofundador de Synthesia que crea mundos 3D
Estudio: La IA aprende a razonar a través de la autoconfianza
Más allá de los datos: ¿Y si tu información pudiera crear?
Todo lo demás en el mundo de la IA hoy

El nuevo Voice Mode de Claude de Anthropic.

Escala con IA: Anthropic acaba de anunciar el lanzamiento de su nuevo Voice mode para las apps móviles de Claude. Seamos sinceros, ¿quién no ha soñado con charlar con una IA como si fuera un amigo? Pues sí, fueron de los últimos grandes laboratorios de IA en subirse al tren de las conversaciones habladas naturales, ¡pero llegaron!

Detalles:

Esta función beta llegará a los usuarios de habla inglesa en las próximas semanas y va a correr sobre el modelo más reciente de Claude, el Sonnet 4.
Puedes pasar de hablar a escribir como si nada, tienen cinco personalidades de voz diferentes (¡para que elijas a tu "voz" favorita!) y la transcripción se muestra en tiempo real.
¿Y si eres suscriptor de pago? Ahí la cosa se pone seria: el Voice mode se integra con Google Workspace. ¡Sí, Claude podrá meterse en tus calendarios, Docs y Gmail con solo una instrucción de voz!
Eso sí, los usuarios gratis tendrán entre 20 y 30 mensajes de voz al mes. Si quieres más, las versiones de pago te darán límites mayores. (para que no te quedes mudo con tu IA tan rápido).

Por qué es importante: A estas alturas, todos los grandes laboratorios de IA ya tienen su propio Voice mode. La verdadera pelea ahora no es si lo tienes, sino qué tan bien lo haces. Estamos hablando de cosas como la latency (que no se quede pensando mientras tú ya estás en otro tema), las integrations (que no viva en su burbuja) y la calidad del modelo base. Y seamos honestos, esto hace que las voces de la vieja escuela, como la de Siri, parezcan de otra era. Te das cuenta de lo atrasadas que están cuando ves lo que estas nuevas IA pueden hacer. ¡Adiós, 'no entendí tu pregunta'! La IA que habla es el presente y el futuro.

La startup de AI para mundos 3D del co-fundador de Synthesia

Escala con IA: ¿Te imaginas crear un mundo entero, así, con unas cuantas palabras? Olvídate de los ladrillos y el sudor, ahora es con AI. ¡Atención, mundo 3D! Matthias Niessner, co-fundador de Synthesia (sí, los de los avatares que parecen gente de verdad), acaba de revelar SpAItial. Esta nueva startup se propone un reto gigante: crear sistemas de AI capaces de generar entornos 3D interactivos a partir de texto e imágenes. ¿Te suena a Matrix? Pues por ahí va la cosa.

Detalles:

La movida es que están desarrollando Spatial Foundation Models (SFMs). Imagínate que son AI que entienden el espacio 3D "de nacimiento", no como algo que tienen que aprender a la fuerza. Captan la geometría, la física y hasta las propiedades de los materiales. O sea, saben que una pared es sólida y un cojín es suave.
El equipo fundador de SpAItial no es cualquier cosa: incluye cerebritos que antes estuvieron en Synthesia, Google y Meta. Esto significa un montón de experiencia en 3D AI y tecnologías de neural rendering.
Ya mostraron demos tempranas que te dejan con la boca abierta: crearon habitaciones 3D fotorrealistas con solo unas frases. ¿Las aplicaciones? Pues piensa en videojuegos (¡adiós a los niveles aburridos!), construcción, VR (realidad virtual para los amigos) y hasta robótica.

Por qué es importante: A ver, la AI ya nos tiene acostumbrados a generar imágenes 2D y videos que parecen de verdad. Pero crear mundos 3D coherentes, que entiendan el espacio de verdad y no se "rompan" cuando te acercas a una pared, eso sí que es un desafío. A todos nos ha pasado que en algún juego o entorno virtual ves algo que no cuadra, ¿verdad?

Pues esta nueva generación de modelos podría cambiarlo todo. Imagina poder crear entornos virtuales complejos con solo describir lo que quieres. Es como si el universo digital se abriera para que cualquiera lo moldee con unas pocas palabras. Sin duda, muchos lo ven como la próxima gran frontera en la AI.

Estudio: La IA aprende a razonar con confianza en sí misma.

Escala con IA: ¿Te ha pasado que tienes que tomar una decisión importante, no tienes toda la información, pero hay algo dentro de ti, un 'pálpito', que te dice que vas por buen camino? Pues, ¡la IA ahora está en esas! Investigadores de UC Berkeley y Yale presentaron INTUITOR, un método de entrenamiento para la IA que permite a los language models mejorar su razonamiento usando 'señales internas de confianza'. Esto elimina la necesidad de tener respuestas correctas o feedback externo. ¡Es como si la IA tuviera su propio 'gut feeling'!

Detalles:

INTUITOR mide cuán 'segura' se siente una IA sobre cada palabra que genera. Usa ese 'gut feeling' (sí, ese pálpito) como su guía para aprender.
En vez de necesitar respuestas correctas para aprender (como en el entrenamiento tradicional de la IA, ¡que es más como un examen donde tienes que acertar!), este sistema recompensa a la IA cuando produce respuestas de las que se siente segura.
Cuando lo probaron con problemas de matemáticas, el método funcionó tan bien como el entrenamiento convencional. ¡Pero ojo! En tareas de programming, ¡los resultados fueron incluso mejores!
Además, las IAs empezaron a mostrar comportamientos de razonamiento súper humanos: descomponiendo problemas complejos, planificando y explicando su forma de pensar step-by-step. ¡Casi como un mentor!

Por que es importante: Tal como la intuición y la confianza son claves en el aprendizaje humano (¿recuerdas cuando sabías la respuesta aunque no supieras explicar por qué?), este estudio demuestra que la IA está triunfando usando un sistema similar. Este enfoque 'autodirigido' podría ser un game-changer, especialmente para tareas donde no hay una respuesta 'correcta' obvia o donde la experiencia humana es limitada. Imagínate: la IA podría aventurarse en áreas de conocimiento completamente inexploradas, ¡sin que nadie le diga cómo hacerlo! Es como darle rienda suelta a la curiosidad, pero en versión digital.

Más allá de los datos: ¿Y si tu información pudiera crear?

Escala con IA: Imagina que tus datos no solo informan, sino que crean: textos, imágenes, música e incluso código funcional. Esto es la IA Generativa (GenAI), una tecnología que está redefiniendo lo posible y transformando la forma en que generamos valor a partir de la información.

Detalles:

Desde 2022, GenAI ha sido clave, especialmente con datos no estructurados. Permite a las empresas:

Crear contenido y borradores automáticamente.
Generar informes personalizados extrayendo insights.
Agilizar el diseño de productos.
Explorar fronteras creativas en arte y música.

Integrar GenAI plantea desafíos (privacidad, seguridad, orquestación). Una solución especializada co-creada con Muze AI facilita la conexión de diversos modelos de IA (LLMs), permite construir asistentes inteligentes que interactúan con tus datos y APIs, gestionar su uso en proyectos y controlar costos. Su implementación exitosa requiere una estrategia centrada en Personas, Ideas y Plataformas.

Por que es importante:

La GenAI no es una promesa futura, es una realidad presente con el poder de redefinir las fronteras de tu negocio. Su capacidad de transformar información en creación tangible la hace revolucionaria. Ya está optimizando la productividad, mejorando la atención al cliente, potenciando ventas y agilizando el acceso a información crítica en diversas industrias. Es el motor potencial de tu próxima gran transformación.

¿Sientes la curiosidad y ves el potencial? Si estas ideas resuenan contigo y quieres explorar cómo la IA Generativa puede ser clave para tu negocio, 🚀 conversemos. sobre cómo implementar tus primeros agentes con Muze AI y empezar a crear sonrisas desde el primer mensaje.

El resto de noticias sobre IA de hoy

Mistral lanzó su Agents API para aplicaciones empresariales, introduciendo conectores para coding, web search y image generation, junto con memory y multi-agent orchestration.
Se rumorea que Meta está reestructurando su organización de IA en dos equipos distintos, enfocados en AI products y AGI foundations, con el objetivo de acelerar el desarrollo de la compañía.
El modelo Claude 4 Sonnet de Anthropic logró un nuevo SOTA en el benchmark ARC-AGI-2, superando a o3 por el primer puesto en el leaderboard.
Google DeepMind adelantó SignGemma, un modelo próximo capaz de traducir el lenguaje de señas a texto.
Salesforce adquirió la empresa de gestión de datos en la nube Informatica por $8B, fortaleciendo la infraestructura que impulsa sus agent-based products y platforms.
The Browser Company reveló que ya no trabajará en su navegador Arc, sino que se enfocará completamente en desarrollar su navegador Dia, que prioriza la IA, como un producto separado.

¡Y eso es todo por hoy en nuestro resumen IA!

¡Y así llegamos al final de nuestro resumen de noticias de IA por hoy! Anthropic nos sorprende con la voz de Claude, SpAItial nos sumerge en mundos 3D interactivos, y la investigación nos muestra cómo la autoconfianza impulsa el aprendizaje de la IA. ¡Esperamos que estos avances te inspiren!

¡Espero que tengas un día genial y lleno de descubrimientos! ¡Nos leemos en la próxima edición de Escala con IA!

Mark, Parte del equipo de Escala con IA.