Escala con IA
Posts
¡OpenAI no para! Lanza o3 y o4-mini, y un nuevo agente para programar.

¡OpenAI no para! Lanza o3 y o4-mini, y un nuevo agente para programar.

Además: Copilot ya puede manejar tu compu por ti.

Marco Chávez
17 de abril de 2025

¡Hola, gente de Escala con IA! ¿Listos para otra dosis de futuro? Parece que OpenAI no duerme. Acaban de sacar del horno dos nuevos modelos, o3 y o4-mini, que según su presi, Greg Brockman, son un salto 'cualitativo hacia el futuro al nivel de GPT-4'. ¡Palabras mayores! Imagínate, dicen que o3 revienta los benchmarks y hasta podría generar ideas científicas nuevas... ¿Será que la AGI (Inteligencia Artificial General, esa que nos iguala o supera) está ya llamando a la puerta? 🤔 ¡Vamos a verlo!

Esto es lo que debes saber acerca de AI:

🤖 OpenAI se saca de la manga o3, o4-mini y un nuevo agente programador
🖥️ Copilot ahora puede usar tu compu como si fueras tú
🔍 Claude se pone modo detective con investigación autónoma
📰 Y un montón de noticias más del mundo IA

OpenAI lanza o3 y o4-mini, y un nuevo agente de coding

Escala con IA: ¡Abróchate el cinturón! OpenAI acaba de lanzar o3 y o4-mini, sus modelos de razonamiento más listos hasta la fecha. Y ojo, que vienen con acceso total tipo agent a todas las herramientas de ChatGPT y la capacidad de "pensar con imágenes". ¡Ah! Y también han soltado un nuevo agente de coding open-source. Casi nada.

Detalles:

OpenAI o3 es el nuevo peso pesado del razonamiento, rompiendo récords (SOTA performance, lo más avanzado del momento) en benchmarks de coding, matemáticas, ciencia y capacidades multimodales.
o4-mini ofrece razonamiento rápido y económico, superando de lejos a los modelos mini anteriores e incluso saturando benchmarks como el de matemáticas AIME 2025. ¡Pequeño pero matón!
Ambos modelos pueden usar y combinar todas las herramientas dentro de ChatGPT (búsqueda web, Python, generación de imágenes, etc.) como parte de su proceso para resolver problemas. Como tener una navaja suiza con superpoderes.
Estos modelos son también los primeros en poder "pensar con imágenes", integrando el análisis y la manipulación visual directamente en su chain of thought (su proceso de pensamiento, vamos).
También lanzan Codex CLI, un agente de coding open-source que funciona en la terminal del usuario y conecta los modelos de razonamiento con tareas de programación. Para los coders de la sala.
El presidente Greg Brockman dijo que este lanzamiento es un "salto cualitativo al futuro al nivel de GPT-4", y que los modelos son capaces de generar ideas científicas novedosas. Palabras mayores.

Por qué es importante: A ver, pongan la meta para la AGI (Inteligencia Artificial General) donde la pongan, da la sensación de que los últimos modelos SOTA (State-Of-The-Art) se están acercando peligrosamente. Si los modelos de razonamiento ya eran un salto brutal, darles acceso a herramientas y capacidades multimodales ha creado una nueva categoría de modelos que generan ideas nuevas. Parece que estamos subiendo al escalón 4 de la famosa escalera de inteligencia artificial de OpenAI. ¿El futuro ya está aquí o qué?

Copilot ahora 'mete mano' en tu ordenador

Escala con IA: ¿Cansado de hacer clic aquí, escribir allá, una y otra vez en las mismas aplicaciones? ¡Pues Microsoft tiene noticias! Acaban de lanzar una nueva capacidad llamada computer use en Copilot Studio. ¿Qué significa esto? Pues que ahora puedes crear agentes de IA que manejan directamente webs y aplicaciones de escritorio por ti. ¡Como tener un becario digital, pero que no se queja!

Detalles:

Esta nueva función permite a los agentes interactuar con las graphical user interfaces (GUIs) – vamos, las ventanas y botones de toda la vida – haciendo clics, seleccionando menús y escribiendo en campos.
Este proceso abre la puerta a automatizar tareas en sistemas que no tienen APIs dedicadas (esas conexiones directas entre programas), dejando que los agentes usen las apps como lo haríamos tú o yo.
Además, Computer Use se adapta en tiempo real si la interfaz cambia, usando razonamiento propio para arreglar problemillas y evitar que el flujo se rompa. ¡Se acabó el "uy, han movido el botón"!
Todo el procesamiento se hace en la infraestructura de Microsoft, y ojo al dato: los datos de empresa quedan explícitamente fuera del entrenamiento de los modelos. Un respiro para la privacidad.

Por qué es importante: Copilot se une así a herramientas similares de Computer Use de gigantes como OpenAI y Anthropic. Es otro paso en ese cambio "agéntico" de la IA: de ser un simple chat a meterse de lleno en el software que usamos a diario. Aunque no es la única herramienta de automatización de interfaces (UI automation), para los usuarios de Microsoft, con sus flujos de trabajo ya montados, es la excusa perfecta para sacarle partido a esta función. ¡A automatizar se ha dicho!

Claude ya puede investigar por su cuenta (¡y mirar tus archivos!)

Escala con IA: ¿Te imaginas tener un asistente que no solo responde preguntas, sino que se pone a investigar por ti en internet y hasta en tus propios documentos? Pues deja de imaginar, porque Anthropic acaba de anunciar unas mejoras bastante potentes para Claude. Ahora viene con capacidades de investigación autónoma y se integra con Google Workspace, ¡casi nada!

Detalles:

La nueva función Research puede buscar solita por la web y entre los datos de trabajo que tengas conectados, dándote respuestas completas y citando sus fuentes. ¡Como un becario aplicado!
Gracias a la integración con Google Workspace, Claude puede acceder de forma segura a tus emails, calendarios y documentos para darte una mano con mucho más contexto, sin que tengas que subir archivos manualmente. Práctico, ¿verdad?
Los clientes Enterprise (los de las grandes ligas) también tienen acceso a una catalogación de documentos mejorada, usando RAG (Retrieval-Augmented Generation) para buscar dentro de repositorios enteros y archivos larguísimos.
La función Research se lanza en beta para los planes Max, Team y Enterprise en EE.UU., Japón y Brasil. La integración con Workspace está disponible para todos los usuarios de pago.

Por qué es importante: A ver, Anthropic parece que se toma las cosas con calma a la hora de lanzar novedades. Otros ya tenían funciones de investigación tipo Deep Research desde hace tiempo. Pero bueno, como ya hemos visto con otros jugadores en este campo, la combinación de búsqueda web, integración con datos del usuario y modelos SOTA (State-Of-The-Art, lo más avanzado) puede dar resultados realmente potentes. ¡Habrá que ver cómo le funciona a Claude!

Más movidas en el mundo de la IA hoy

OpenAI está negociando, según rumores, la compra de la plataforma de coding Windsurf (antes Codeium). Ojito, que la cosa podría valer unos 3.000 millones de dólares.

Los investigadores de Microsoft han presentado BitNet b1.58 2B4T, un nuevo modelo de IA de 1 bit que, ojo al dato, iguala el rendimiento de modelos más grandes pero funcionando eficientemente en CPUs normales y corrientes. ¿Magia? Casi.

Tencent ha lanzado FireEdit, un nuevo sistema de edición de imágenes con IA que usa region-aware vision language models (básicamente, modelos que entienden qué parte de la imagen quieres tocar) para hacer modificaciones más precisas siguiendo tus instrucciones. Se acabó el pelearse con el editor.

Anthropic se prepara, al parecer, para lanzar este mes un nuevo “voice mode” para Claude. Tendrá tres voces de IA distintas llamadas Airy, Mellow y Buttery. ¿A cuál le pedirás que te cuente un chiste?

Metr, el partner de testing de OpenAI, ha publicado su análisis de o3 y 4o-mini. Destacan una evaluación acelerada, lo que coincide con otros informes que hablaban de prisas en las pruebas de seguridad. Ups.

El economista y autor Tyler Cowen ha dicho que cree que o3 ya califica como AGI (Inteligencia Artificial General). Se pregunta si el 16 de abril será recordado como el día en que cruzamos esa barrera. ¿Tú qué piensas?

¡Y eso es todo por hoy en nuestro resumen IA!

OpenAI, Microsoft, Anthropic... todos apretando el acelerador hacia IAs más listas y autónomas. ¡Esto se pone interesante! Nosotros seguiremos con los ojos bien abiertos para contarte todo. 😉

¡Que tengas un día genial y sigas flipando con todo lo que la IA puede hacer! ¡Nos leemos en la próxima!

Mark, Parte del equipo de Escala con IA.