Escala con IA
Posts
Windsurf lanza su modelo de IA interno para desarrolladores

Windsurf lanza su modelo de IA interno para desarrolladores

ADEMÁS: Uso de Poe revela cambios en la popularidad de la IA

Marco Chávez
16 de mayo de 2025

¡Muy buenos días, gente de Escala con IA! Arrancamos el día navegando por nuevas aguas (literalmente, por el nombre) con Windsurf, la plataforma de código asistido por IA. ¡Acaban de soltar al mundo su propio modelo interno! Se llama familia SWE-1 y, ojo, está diseñado para hacer que la ingeniería de software sea más fácil, paso a paso. ¿Se acuerdan que hace poco sonó súper fuerte la noticia de que OpenAI los iba a comprar por la módica suma de $3 mil millones de dólares? Pues bien, con este lanzamiento, ¡saltó la liebre! ¿Será que la tecnología que impulsa este modelo es la verdadera joyita escondida detrás de esa compra millonaria de OpenAI? Mmm, ¡sospechoso, sospechoso!

Esto es lo que debes saber acerca de AI:

🏄‍♂️ Windsurf lanza su IA interna para desarrolladores
📊 Uso de Poe muestra cambios en popularidad de la IA
Más allá de los datos: ¿Y si tu información pudiera crear?
😵‍💫 Estudio: LLM luchan con conversaciones de ida y vuelta
4 nuevas herramientas IA y 4 oportunidades laborales

La IA interna de Windsurf para desarrolladores

Escala con IA: ¿Te ha pasado que usas una IA para programar, te ayuda un montón con el código, pero luego te deja solo con el terminal, el navegador, y todo el resto del despelote que implica desarrollar software? Pues parece que la gente de Windsurf escuchó ese lamento (o quizás el de sus propios devs) y acaba de lanzar algo que promete cubrir la cancha completa.

La plataforma de codificación con IA Windsurf acaba de lanzar SWE-1, su primera familia de modelos de IA internos, diseñados específicamente para ayudar con todo el ciclo de vida de la ingeniería de software, no solo a generar código. Piensa en un copiloto que no solo te dicta la ruta, sino que también te ayuda a cargar el equipaje, revisar el motor y hasta a encontrar dónde estacionar.

Detalles:

La familia SWE-1 incluye tres modelos: SWE-1 (el grandote, para usuarios de pago), SWE-1-lite (que reemplaza a Cascade Base para todos los usuarios, ¡gratis!), y SWE-1-mini (el más ligero).
Los benchmarks internos (ya sabes, esos resultados que siempre son los más optimistas) muestran que SWE-1 supera a todos los modelos no "frontier" y de código abierto, quedándose justo detrás de pesos pesados como Claude 3.7 Sonnet. Impresionante.
A diferencia de los modelos tradicionales que se enfocan solo en generar código, Windsurf entrenó SWE-1 para manejar múltiples interfaces: editores, terminales, y navegadores. La idea es que la IA entienda y te ayude donde sea que estés trabajando en tu proyecto.
Los modelos usan un sistema que llaman "flow awareness" (conciencia de flujo), que crea una especie de línea de tiempo compartida entre tú y la IA. Esto permite que se pasen la "pelota" de forma fluida durante el proceso de desarrollo.

Por qué es importante: Mientras que las plataformas de codificación como Windsurf han sido tradicionalmente "capas" que usaban modelos de terceros (como si fueras un restaurante que solo usa ingredientes de otros proveedores), este lanzamiento de modelos propios es un un gran cambio. Y ojo al dato, llega (probablemente de forma estratégica) justo días después de que se rumoreara una posible adquisición por $3 mil millones por parte de OpenAI. Con este lanzamiento tan fuerte, puede que haya más tela que cortar en ese posible acuerdo de lo que pensábamos inicialmente. ¿Quizás OpenAI no solo compra talento o usuarios, sino también tecnología clave? Interesante...

Los gráficos de uso de Poe revelan cambios en la popularidad de la IA

Escala con IA: A ver, hablemos de popularidad... pero en el mundo de la IA. La plataforma Poe, que es como el punto de encuentro de varios modelos de IA, acaba de publicar su informe de Tendencias de Uso de Modelos de IA Primavera 2025. Y ojo, que no es solo una lista; revela cómo están cambiando las preferencias de la gente al usar IA para texto, razonamiento, imágenes y video. ¡Y los modelos nuevos están subiendo como la espuma mientras otros veteranos ceden terreno!

Detalles:

GPT-4.1 y Gemini 2.5 Pro se lanzaron y en cuestión de semanas ¡capturaron el 10% y 5% del total de mensajes! Mientras tanto, Claude vio una caída del 10% en el mismo periodo. Durísimo.
Los modelos de Reasoning (los que son buenos pensando y analizando) saltaron de solo un 2% a un 10% de todos los mensajes de texto desde enero. Gemini 2.5 Pro solito se lleva casi un tercio de esta subcategoría. ¡Inteligencia al poder!
En la generación de imágenes, GPT-image-1 ganó un 17% de uso, metiéndole presión a los líderes como FLUX de Black Forest Labs y la familia Imagen3 de Google.
Para video, la familia Kling de China se convirtió en un contendiente top con ~30% de uso justo después de su lanzamiento. En audio, ElevenLabs sigue dominando con un impresionante 80%.

Por qué es importante: Este reporte de Poe nos da una mirada valiosa y real sobre qué modelos prefiere la gente en el día a día, más allá de los benchmarks teóricos. También muestra lo rápido que cambian las preferencias con cada nuevo lanzamiento. Con modelos mejorando casi cada semana, ¡prepárate para que esta lista se vea totalmente diferente en solo unos meses! Es la ley de la selva... digital.

Más allá de los datos: ¿Y si tu información pudiera crear?

Escala con IA: Imagina que tus datos no solo informan, sino que crean: textos, imágenes, música e incluso código funcional. Esto es la IA Generativa (GenAI), una tecnología que está redefiniendo lo posible y transformando la forma en que generamos valor a partir de la información.

Detalles:

Desde 2022, GenAI ha sido clave, especialmente con datos no estructurados. Permite a las empresas:

Crear contenido y borradores automáticamente.
Generar informes personalizados extrayendo insights.
Agilizar el diseño de productos.
Explorar fronteras creativas en arte y música.

Integrar GenAI plantea desafíos (privacidad, seguridad, orquestación). Una solución especializada co-creada con Muze AI facilita la conexión de diversos modelos de IA (LLMs), permite construir asistentes inteligentes que interactúan con tus datos y APIs, gestionar su uso en proyectos y controlar costos. Su implementación exitosa requiere una estrategia centrada en Personas, Ideas y Plataformas.

Por qué es importante: La GenAI no es una promesa futura, es una realidad presente con el poder de redefinir las fronteras de tu negocio. Su capacidad de transformar información en creación tangible la hace revolucionaria. Ya está optimizando la productividad, mejorando la atención al cliente, potenciando ventas y agilizando el acceso a información crítica en diversas industrias. Es el motor potencial de tu próxima gran transformación.

¿Sientes la curiosidad y ves el potencial? Si estas ideas resuenan contigo y quieres explorar cómo la IA Generativa puede ser clave para tu negocio, conversemos.

Estudio: a los LLMs les cuesta el chateo de ida y vuelta

Escala con IA: ¿Te ha pasado que estás en una conversación (o haciendo algo complejo) y de repente... te pierdes? Como que la cosa se enredó y ya no sabes ni qué estabas buscando o cuál era el punto inicial. Bueno, parece que a las inteligencias artificiales más avanzadas les pasa algo parecido, ¡y no es chiste!

Un nuevo estudio de investigadores de Microsoft y Salesforce encontró que los LLMs rinden significativamente peor durante conversaciones de varias vueltas, donde las instrucciones del usuario se van revelando gradualmente. A menudo se "pierden" y no logran recuperarse. Ya te imaginarás, ¡un dolor de cabeza para los que dependemos de ellos para cosas complejas!

Detalles:

Los investigadores probaron 15 LLMs líderes, incluyendo Claude 3.7 Sonnet, GPT-4.1 y Gemini 2.5 Pro, en seis tareas de generación diferentes.
El estudio reveló que los modelos alcanzaron un 90% de éxito en single-turn settings (cuando la instrucción se da de una vez), pero cayeron a aproximadamente un 60% cuando la conversación duró multiple turns.
Los modelos tienden a "perderse" saltando a conclusiones, intentando soluciones antes de tener toda la info necesaria y construyendo sobre respuestas iniciales (a menudo incorrectas). Es como si tuvieran prisa o se creyeran que ya entendieron todo antes de tiempo.
Ni los temperature changes (ajustes en su "creatividad") ni los reasoning models (modelos de razonamiento) mejoraron la consistencia en las pruebas de multi-turn. Incluso los LLMs top experimentaron una volatilidad masiva, a veces lo hacían bien, a veces fatal.

Por que es importante: Esta investigación expone una brecha enorme entre cómo se evalúan típicamente los LLMs (generalmente con instrucciones directas y de una sola vez) y cómo se usan en realidad (en chats de ida y vuelta, pidiéndoles ajustes o más detalles). Esto muestra que los desarrolladores quizás necesiten enfocarse más en priorizar la confiabilidad y el manejo del context window management (cuánto recuerdan de la conversación) en back-and-forth conversations (conversaciones de ping-pong) en lugar de solo optimizar para one-and-done prompts (instrucciones de una sola vez). En pocas palabras: ¡necesitan aprender a chatear mejor!

El resto de noticias sobre IA de hoy

You.com anunció que su plataforma de investigación avanzada, ARI, supera a OpenAI’s Deep Research con un 76% de victorias, y de paso lanzó nuevas funciones para empresas.
Meta, al parecer, está retrasando el lanzamiento de su modelo estrella, Llama Behemoth, de junio al otoño gringo, ¿la razón? Dicen que no vieron una mejora significativa.
OpenAI lanzó su "OpenAI to Z Challenge", invitando a usar sus modelos para ayudar a descubrir sitios arqueológicos en la selva amazónica. ¿El premio? $250.000 dólares. ¡Nada mal!
Salesforce está adquiriendo la startup de AI agents Convergence AI. Los planes son integrar el equipo y la tecnología a su plataforma Agentforce.
Intelligent Internet lanzó II-Medical-9B, un modelo pequeño enfocado en medicina con un rendimiento comparable a GPT 4.5, pero que corre localmente y sin costo de inferencia. ¡Interesante para el sector salud!
Manus AI introdujo la generación de imágenes, permitiendo que esta AI agent pueda realizar tareas visuales con una planificación paso a paso.

¡Y eso es todo por hoy en nuestro resumen IA!

¡Y con esta reflexión nos despedimos por hoy! Windsurf nos deja pensando en el valor real de su tecnología, mientras otros datos nos muestran cómo se mueve el interés por la IA en el mundo. ¡La cosa está que arde!

¡Espero que tengas un día genial y lleno de descubrimientos! ¡Nos leemos en la próxima edición de Escala con IA!

Mark, Parte del equipo de Escala con IA.