Claude 4 debuta dos nuevos modelos centrados en codificación y razonamiento

Mientras el mundo asimila la borrachera de anuncios de Alphabet en Google IO, unos presente, otros futuro y otros «ya veremos» (como nos tiene acostumbrados), Anthropic ha anunciado una nueva evolución de su modelo Claude, Claude Opus 4 y Claude Sonnet 4. Anthropic dice que los modelos establecen «nuevos estándares para la codificación, el razonamiento avanzado y los agentes de IA».

Según Anthropic, Claude Sonnet 4 es una actualización significativa de Claude Sonnet 3.7, que ofrece una codificación y un razonamiento mejorados junto con la capacidad de responder a las instrucciones con mayor precisión. Claude Opus 4 está diseñado para la codificación, entre otras tareas, y ofrece un rendimiento sostenido para tareas complejas y de larga duración y flujos de trabajo de agentes.

Claude Opus 4 es el modelo más poderoso de Anthropic hasta la fecha, y es el mejor modelo de codificación del mundo con una puntuación del 72,5 por ciento en SWE-bench y una puntuación del 43,2 por ciento en Terminal-bench. Puede proporcionar un rendimiento sostenido durante varias horas en tareas que tienen miles de pasos.

Claude Sonnet 4 está diseñado para equilibrar el rendimiento y la eficiencia. No coincide con Opus 4 para la mayoría de los dominios, pero Anthropic dice que está destinado a proporcionar una combinación óptima de capacidad y practicidad.

Ambos modelos tienen una función beta para el pensamiento extendido, y pueden usar la búsqueda web y otras herramientas para que Claude pueda alternar entre el razonamiento y el uso de herramientas. Las herramientas se pueden usar en paralelo, y los modelos tienen memoria mejorada cuando se les proporciona acceso a archivos locales. Claude es capaz de guardar hechos clave para mantener la continuidad y construir conocimiento a lo largo del tiempo.

Anthropic ha reducido el comportamiento en el que los modelos usan atajos o lagunas para completar tareas, y los resúmenes de pensamiento condensan largos procesos de pensamiento.

Claude Code, una herramienta de codificación de agentes que vive en la terminal, ahora está ampliamente disponible después de las pruebas. Claude Code admite tareas en segundo plano con GitHub Actions e integraciones nativas con VS Code y JetBrains, y es capaz de editar archivos y corregir errores, responder preguntas sobre código y más.

Los suscriptores con los planes Pro, Max, Team y Enterprise Claude tienen acceso a Claude Opus 4 y Claude Sonnet 4 a partir de hoy, mientras que Sonnet 4 está disponible para usuarios gratuitos. Los modelos están disponibles para los desarrolladores en Anthropic API, Amazon Bedrock y Google Cloud Vertex AI.

Alf

Propietario de www.faq-mac.com.

Deja una respuesta