• Escala con IA
  • Posts
  • ¡Increíble! Dos estudiantes crean IA de voz SOTA... ¡sin un centavo!

¡Increíble! Dos estudiantes crean IA de voz SOTA... ¡sin un centavo!

ADEMÁS: The Washington Post se une a la alianza de OpenAI

¡Muy buenos días, gente de Escala con IA! A veces pensamos que para lograr algo grande en tech, necesitas un equipo gigante, una oficina de lujo y bolsillos llenos. Pues agárrate, porque dos estudiantes universitarios coreanos nos acaban de demostrar que... ¡nada que ver! Estos cracks, con poca experiencia en IA y cero financiamiento, se tomaron en serio eso que dijo Sam Altman de 'you can just build things' y ¡crearon un modelo de voz open-source que supera a los líderes de la industria! Esto confirma algo que venimos viendo: con las herramientas y recursos de IA cada vez más accesibles globalmente, la era de los 'solo builders' compitiendo de tú a tú con laboratorios de miles de millones... ya llegó.

Esto es lo que debes saber acerca de AI:

  • 🗣️ Dos estudiantes revelan IA de voz SOTA

  • 📰 The Washington Post se une a la alianza de OpenAI

  • 💼 CISO de Anthropic: Se vienen los 'empleados' IA

  • 📰 Todo lo demás en IA hoy

¡Boom! Dos universitarios sacuden el mundo de la voz con IA

Escala con IA: Ya te imaginarás el shock cuando una startup coreana, Nari Labs, fundada por solo dos universitarios ¡sin un centavo de financiación! lanzó Dia. Es un modelo open-source de text-to-speech que, agárrate, dice superar a los grandes del mercado como ElevenLabs y Sesame. ¿Cómo te quedas?

Detalles:

  • Este modelo de 1.6B parameter model no es cualquier cosa. Soporta emotional tones, multiple speaker tags y hasta nonverbal cues como risas, toses y gritos. ¡Imagina ponerle emoción real a tus audios!

  • Se inspiraron en Google’s NotebookLM y, ojo al dato, usaron el programa Google’s TPU Cloud para conseguir acceso a compute. ¡Aprovechando los recursos!

  • En pruebas comparativas side-by-side, Dia realmente outshines a ElevenLabs Studio y Sesame CSM‑1B en timing, expressiveness y cómo maneja los nonverbal scripts. Parece que los novatos dieron una cátedra.

  • Toby Kim, el fundador de Nari Labs, ya anunció planes para una consumer app enfocada en social content creation y remixing basada en este modelo. Viene con todo.

Por qué es importante:  La historia de Dia es la prueba viviente de aquel famoso tweet de Sam Altman: ‘you can just do things’ tweet (algo así como "simplemente puedes hacer las cosas"). Dos undergrads sin mucha experiencia entrenaron un modelo open-source que compite codo a codo con lo mejor del voice tech del mercado. Sinceramente, nunca ha habido un mejor momento para intentar construir algo. La IA está abriendo un acceso al aprendizaje y a la capacidad de hacer cosas como nunca antes. ¡Es hora de ponerse manos a la obra!

El Washington Post se alía con OpenAI

Escala con IA: ¿Te ha pasado que le preguntas algo a ChatGPT sobre una noticia reciente y la respuesta es como un "esto pasó hace un tiempo" o te da información un poco... floja? Bueno, parece que esa realidad podría empezar a cambiar para mejor. Resulta que The Washington Post acaba de anunciar un acuerdo fresquito con OpenAI para que el líder de la IA pueda meter resúmenes y links directos de sus reportajes en las respuestas de ChatGPT.

Detalles:

  • Ahora, cuando le preguntes algo a ChatGPT, verás resúmenes, citas y enlaces directos a artículos relevantes de The Washington Post.

  • Este acuerdo suma al Post (que es de Jeff Bezos, el de Amazon) a la lista creciente de socios de medios de OpenAI, ¡ya van más de 20 grandes medios!

  • Y ojo, esto pasa justo mientras OpenAI anda en batallas legales con otros peces gordos de los medios, como The NYT, por temas de copyright y datos de entrenamiento.

  • Por su lado, The Washington Post no es ajeno a experimentar con IA. Han lanzado herramientas como Ask The Post AI y Climate Answers en el último año.

Por qué es importante: Aquí vemos a otro medio gigante que prefiere la estrategia de la alianza antes que la de los juicios. Apuestan a que aparecer en ChatGPT es clave para llegar a más gente en todo el mundo. Para OpenAI, significa tener acceso a contenido más fiable para entrenar su IA. Y tener a un peso pesado como WaPo uniéndose a su bando, de alguna manera, aísla un poco más a otros medios como The NYT, que están dando la pelea en los tribunales. La cosa se pone interesante en el pulso entre medios y plataformas de IA.

Anthropic CISO: Se avecinan los empleados IA.

Escala con IA: El Jefe de Seguridad de la Información de Anthropic, Jason Clinton, acaba de predecir que los "empleados virtuales" potenciados por IA empezarán a operar en las redes corporativas dentro del próximo año. Sí, has leído bien. Y claro, esto trae consigo un montón de nuevos dolores de cabeza en "security management".

Detalles:

  • Estos "AI employees" tendrían sus propias "corporate accounts", "passwords" y hasta "memories". O sea, un nivel mucho más avanzado que los "AI agents" actuales, que solo hacen tareas específicas.

  • Clinton señaló que los desafíos de seguridad incluirán gestionar los "account privileges" de la IA, "monitoring access" y determinar la responsabilidad ("responsibility") por sus acciones "autonomous actions". Básicamente, ¿quién paga el pato si la IA la lía?

  • Él ve a los "virtual employees" como el próximo "AI innovation hotbed", y la seguridad de estos "virtual employee security" como un área que va a explotar en importancia a la par.

  • Anthropic, por su parte, dice que está a lo suyo, enfocados en asegurar sus propios "AI models" contra "attacks" y vigilando posibles áreas de "misuse".

Por que es importante: El trabajo, tal como lo conocemos, está a punto de pegar un giro de 180 grados en la era de la IA. Y con eso, las medidas de seguridad ("cybersecurity practices") que necesitamos para este nuevo tipo de colega. La gran pregunta es si estas prácticas se actualizarán lo suficientemente rápido. ¿O tendremos que esperar a un "major breach" o "exploit" gordo para darnos cuenta de las nuevas amenazas que presentan los "autonomous AI workers"? Esperemos que no.

El resto de noticias sobre IA de hoy

  • El jefe de producto de OpenAI, Nick Turley, testificó en el juicio antimonopolio de Google que el líder en AI estaría interesado en comprar su navegador Google Chrome si se forzara una venta.

  •   Apple eliminó las afirmaciones "disponible ahora" de su página de marketing de Apple Intelligence tras las preocupaciones de la National Advertising Division sobre disponibilidad engañosa.

  •   Character AI lanzó AvatarFX, una plataforma de AI que permite a los usuarios crear avatares parlantes de formato largo y coherentes a partir de una sola foto de referencia y selección de voz.

  •  IBM y la European Space Agency lanzaron TerraMind, un sistema de AI de código abierto que utiliza nueve data modalities y satélites para la monitorización del clima en tiempo real.

  •  El CEO de Cohere, Aidan Gomez, se unió a la junta directiva del fabricante de vehículos eléctricos Rivian, con el objetivo de integrar la tecnología AI de manera más amplia en los productos y la fabricación de la empresa.

  •  Motorola lanzó SVX, un nuevo dispositivo impulsado por AI que combina una cámara corporal, altavoces y un AI assistant para reducir los tiempos de respuesta de emergencia.

¡Y eso es todo por hoy en nuestro resumen IA!

¡Y así cerramos este resumen de noticias IA por hoy! La innovación sigue sorprendiéndonos, demostrando que las grandes ideas pueden venir de cualquier parte.

¡Espero que tengas un día genial y lleno de descubrimientos! ¡Nos leemos en la próxima edición de Escala con IA!

Mark, Parte del equipo de Escala con IA.