• Escala con IA
  • Posts
  • El inesperado 'problema de personalidad' de GPT-4o

El inesperado 'problema de personalidad' de GPT-4o

Además: Alibaba lanza el modelo de IA open-weight Qwen3

¡Muy buenos días, gente de Escala con IA! ¿Te ha pasado que una actualización de software te cambia las cosas de formas raras? Pues agárrate, porque la última versión de ChatGPT, GPT-4o, ¡anda con un 'problema de personalidad' que hasta Sam Altman ha dicho que es "molesto"! Pero tranqui, el mundo IA sigue girando y hoy también te contamos de nuevos modelos potentes open-weight y cómo la IA te puede ayudar a comprar más inteligentemente.

Esto es lo que debes saber acerca de AI:

  • 👎 El nuevo 'problema de personalidad' de GPT-4o

  • 🤖 Alibaba lanza su modelo de IA Qwen3 (open-weight)

  • 🛍️ ChatGPT Search mejora su juego en las compras online

  • 📰 Y otras noticias rápidas del mundo IA

El nuevo drama de personalidad de GPT-4o

Escala con IA: Escala con IA: Ya te imaginarás, a todos nos ha pasado. Hablas con alguien y parece que le encantas, te da la razón en todo, te tira flores por cualquier cosa. Un poco demasiado, ¿no?

Bueno, parece que la Inteligencia Artificial también puede caer en eso. OpenAI está trabajando para solucionar un tema inesperado con su recién actualizado GPT-4o. Resulta que los usuarios y hasta líderes tech se dieron cuenta de que la AI se puso excesivamente aduladora y con una tendencia a estar de acuerdo contigo en todo, incluso con ideas que quizás no son las mejores (o son directamente incorrectas).

Detalles:

  • OpenAI lanzó la versión actualizada de 4o la semana pasada, prometiendo mejoras en la memoria, la capacidad de resolver problemas y, ojo, en la personalidad y la inteligencia.

  • Pero ¡sorpresa!, los usuarios empezaron a notar que la actualización hizo a GPT-4o demasiado complaciente y agradable, validando a veces afirmaciones cuestionables o incluso falsas.

  • Sam Altman, el jefe de OpenAI, publicó que 4o se volvió “annoying” (molesto) y “sycohant-y” (adulador), señalando que eventualmente necesitan ofrecer múltiples opciones de personalidad dentro de cada modelo.

  • OpenAI ya desplegó un fix inicial para reducir este comportamiento de “glazing” (como de estar cubriendo algo con un glaseado dulce... o sea, endulzando demasiado la píldora), y tienen planeados más updates durante la semana para encontrar el equilibrio justo.

  • Veteranos de la industria advierten que el problema va más allá de ChatGPT, sugiriendo que es un desafío más amplio que enfrentan los AI assistants diseñados para maximizar la satisfacción del usuario.

Por qué es importante: Este “upgrade” de personalidad, que terminó siendo medio “downgrade” para algunos, está revelando un problemón: la dificultad de encontrar el balance entre tener interacciones positivas y largas con el usuario y ser, al mismo tiempo, veraz y responsable. Con millones de personas teniendo conversaciones profundas y a menudo aceptando lo que dice la AI como la verdad absoluta, esta situación con 4o es una pendiente resbaladiza para el desarrollo de modelos. Nos recuerda que hacer que una AI sea útil y segura es un arte (y una ciencia) muy complicada.

Alibaba lanza Qwen3 open-weight

Escala con IA: ¿Te acuerdas cuando comentábamos que China venía pisando fuerte en esto de la inteligencia artificial? Pues agárrate, porque el laboratorio de IA Qwen de Alibaba acaba de lanzar Qwen3, una nueva familia de ocho modelos de lenguaje open-weight que trae un sistema de pensamiento híbrido y nuevas agentic capabilities. Y ojo, que sus benchmarks rivalizan con los de grandes como OpenAI, DeepSeek y xAI. ¡Esto se pone interesante!

Detalles:

  • El modelo estrella, Qwen3-235B, iguala el rendimiento de modelos mucho más grandes como el o1 de OpenAI, Grok-3 y DeepSeek-R1 en benchmarks clave.

  • Las mejoras incluyen modos de "pensamiento" híbridos para razonamiento profundo o respuestas rápidas, habilidades mejoradas de coding/agent, y soporte para 119 idiomas.

  • La versión incluye 8 modelos, desde una versión ligera de 600M parameter hasta el completo 235B, con los modelos pequeños mostrando grandes avances respecto a versiones anteriores.

  • Los ocho modelos se lanzan con open weights y una Apache 2.0 license, y están disponibles a través de plataformas como Hugging Face o mediante local o cloud deployment.

Por qué es importante: Ayer comentábamos cómo China está cerrando rápidamente la brecha en modelos de IA, y hoy, Qwen lanza una familia open-weight que acerca aún más tanto al país como al movimiento open-source a igualar a los laboratorios líderes. Con la impresionante jugada de Qwen ya en la cancha, todas las miradas se giran ahora hacia DeepSeek y el anticipado lanzamiento de su R2.

ChatGPT Search mejora su juego de compras.

Escala con IA: ¿Te ha pasado que quieres comprar algo online, pero la búsqueda es un caos? Tienes que abrir 50 pestañas, comparar precios, leer mil opiniones... ¡Es agotador! Imagina que la IA pudiera hacer eso por ti, como un asistente personal de compras. Pues bien, OpenAI está dando un paso gigante en esa dirección.

Acaban de lanzar nuevas capacidades de compra dentro de la función Search de ChatGPT. Ahora, buscar productos debería ser mucho más fácil y visual, con recomendaciones impulsadas por IA.

Detalles:

La actualización te ofrece sugerencias de productos personalizadas. Solo le preguntas usando lenguaje natural, como si le hablaras a una persona y te responde con imágenes, comparaciones de precios y resúmenes de opiniones.

Por ahora, los resultados son no pagados, basados en la info de los datos de sus colaboradores como opiniones y precios. Nada de lugares pagados ni comisiones de afiliados por el momento. ¡Pura sugerencia imparcial!

Los usuarios Pro and Plus pronto tendrán una experiencia de compra aún más personalizada gracias a la función memory feature de ChatGPT, que recuerda tus conversaciones pasadas para darte productos más afines a ti.

La mejora de Search también incluye otras cosas útiles: integración con WhatsApp, citas mejoradas que te muestran exactamente dónde encontró la info, y sugerencias de autocompletar tipo Google-style autocomplete suggestions mientras escribes.

Por que es importante: Sí, Google sigue siendo el rey indiscutible de las búsquedas de productos hoy en día. Pero los LLMs (Large Language Models) como ChatGPT siguen "comiéndose" una parte de las búsquedas web tradicionales. La gente se está acostumbrando a quedarse en el chat para todo. Esto significa que optimizar tu contenido para que sea encontrado y bien interpretado por los LLMs pronto será tan importante como el famoso SEO (Search Engine Optimization). Es un cambio de hábitos que ya está aquí.

🛠️ Herramientas de IA del momento

  •  🤖 Ernie 4.5 Turbo & X1 Turbo - Baidu saca nuevos LLMs (Large Language Models) rápidos y asequibles.

  •  🧐 OpenAI Deep Research - Una versión ligera para investigación, potenciada por o4-mini.

  •  🔊 Kimi-Audio - Moonshot AI lanza un modelo de audio open-source y 'state-of-the-art' (SOTA).

  •  🎥 KLING 2.0 - Generación y edición de video e imagen con IA a otro nivel.

El resto de noticias sobre IA de hoy

¿Te imaginas que tu paquete te lo entregue un robot humanoide? Pues Figure AI y United Parcel Service (UPS) están en charlas para que esto pase en los procesos de envío y logística.

Los detalles: Están explorando cómo estos robots podrían ayudar en almacenes y entregas. Escala con IA: Esta alianza podría ser un gran salto para automatizar tareas físicas a gran escala.

El CEO de Duolingo, Luis von Ahn, publicó un email a toda la empresa declarándola "AI-first". ¿Qué significa? Que le meterán la tecnología a todo, desde la contratación y evaluaciones hasta escalar el entrenamiento en IA. Por que es importante: Ver a una empresa de ed-tech tan grande apostar fuerte por la IA muestra la tendencia clara del mercado y cómo impactará la educación.

P-1 AI emergió del "modo sigilo" (stealth) con $23 millones de dólares en financiación inicial (seed funding) para crear a "Archie", un agente de IA enfocado en ingeniería que automatizará tareas cognitivas en sistemas físicos.

Los detalles: La idea es básicamente tener un ingeniero virtual que piense por sí solo. Escala con IA: Podría ser una herramienta brutal para diseño, simulación y optimización de sistemas físicos a nivel industrial.

Cisco lanzó Foundation AI, una nueva organización enfocada en seguridad. ¿El plan? Desarrollar modelos de IA especializados para defenderse de amenazas de ciberseguridad y, lo mejor, ¡hacerlos open-source! Por que es importante: La ciberseguridad es clave en nuestro mundo digital, y usar IA (abierta) para mejorarla es una gran noticia para protegernos mejor.

Luma Labs liberó una nueva API para sus Ray2 Camera Concepts, permitiendo que los desarrolladores integren los controles avanzados de video con IA de su modelo en sus propias aplicaciones. Los detalles: Facilita mucho crear herramientas que manipulen video de forma inteligente. Escala con IA: Abre puertas para que más gente cree apps de edición o creación de contenido aprovechando la IA de Luma.

Higgsfield AI presentó Iconic Scenes, una nueva función que re-crea escenas famosas de películas con una persona diferente... ¡usando solo una selfie! Por que es importante: Más allá de lo divertido (¡imagina tu cara en una escena épica!), es otro ejemplo de lo avanzada que está la generación y edición de imágenes/video con IA, y cómo se puede usar para contenido personalizado y viral.

¡Y eso es todo por hoy en nuestro resumen IA!

Vimos que hasta la IA más top puede tener sus 'días difíciles' (¡hola, GPT-4o!), que la competencia open-weight se pone seria con Qwen3, y que hasta ir de shopping online es más smart ahora. ¡El ritmo de la IA no baja!

¡Espero que tengas un día genial y lleno de descubrimientos! ¡Nos leemos en la próxima edición de Escala con IA!

Mark, Parte del equipo de Escala con IA.