Anthropic ha introducido Opus 4.5, su modelo de frontera principal, que presenta capacidades de programación mejoradas y mejoras en la experiencia del usuario, posicionándolo para competir con los últimos modelos de OpenAI.
Una actualización clave para los usuarios es el mejor flujo de conversación en aplicaciones de consumo (web, móvil y escritorio). El modelo, Claude, ahora evitará detener abruptamente las discusiones debido a conversaciones prolongadas. Esta mejora se aplica a Opus 4.5 así como a otros modelos Claude actuales en estas plataformas.
Anteriormente, los usuarios enfrentaban paradas inesperadas de conversaciones debido a alcanzar un límite estricto de ventana de contexto de 200,000 tokens, incluso si tenían margen de uso restante. Mientras que algunos modelos de lenguaje grande manejan esto recortando mensajes anteriores, Claude terminaba la discusión para prevenir una disminución en la coherencia de la conversación. Con la nueva actualización, Claude resumirá puntos esenciales de la conversación anterior, descartando contenido menos crucial para mantener la relevancia y coherencia.
Para los desarrolladores que utilizan la API de Anthropic, las mismas técnicas de gestión de contexto y resumen están disponibles para un control mejorado sobre las interacciones.
En términos de rendimiento, Opus 4.5 establece un nuevo punto de referencia al lograr una puntuación de precisión del 80.9 por ciento en la referencia SWE-Bench Verified. Esto supera al recientemente introducido por OpenAI, GPT-5.1-Codex-Max (77.9 por ciento) y al Gemini 3 Pro de Google (76.2 por ciento). Mientras que Opus 4.5 sobresale en programación agente y puntos de referencia de uso de herramientas, continúa quedando atrás de GPT-5.1 en habilidades de razonamiento visual (MMMU).