Anthropic quiere dominar el mercado de los agentes de IA con Claude Opus 4.6, su último modelo

Anthropic lanzó Claude Opus 4.6, el modelo de inteligencia artificial (IA) más avanzado desarrollado por la empresa hasta la fecha, el cual destaca por contar con capacidades de codificación superiores a las de su predecesor. Esta nueva versión incorpora mejoras significativas en planificación, revisión y depuración de código, así como en la extracción de información a partir de grandes volúmenes de datos y en tareas de programación agéntica.
De acuerdo con la compañía, Claude Opus 4.6 también puede aplicar estas capacidades a una amplia gama de actividades cotidianas. Entre ellas se incluyen el análisis financiero, la investigación avanzada y la creación, uso y edición de documentos, hojas de cálculo y presentaciones. “En Cowork, donde Claude puede realizar múltiples tareas de forma autónoma, Opus 4.6 pone todas estas habilidades al servicio del usuario”, explicaron los desarrolladores de Anthropic.
Una de las características más destacadas de Claude Opus 4.6 es su ventana de contexto de hasta un millón de tokens, una capacidad que le permite procesar grandes cantidades de información sin sufrir degradación por longitud. Este problema suele presentarse cuando las conversaciones o los documentos superan cierto umbral de tokens, lo que provoca un fenómeno conocido como atención dispersa, en el que la IA pierde coherencia factual e ignora instrucciones iniciales relevantes.
Claude Opus 4.6 es el primer modelo de Anthropic en operar con un contexto de esta magnitud. Más allá de permitirle analizar volúmenes extensos de datos con un alto nivel de detalle, esta ventaja técnica contribuye a mantener la consistencia lógica y la fidelidad de la información a lo largo de interacciones prolongadas. De esta manera, el modelo puede sostener razonamientos complejos sin perder el hilo de las instrucciones originales, incluso en tareas de larga duración.
En la prueba MRCR v2, diseñada para evaluar la capacidad de los modelos de IA para recuperar información específica oculta dentro de grandes cantidades de texto, Opus 4.6 obtuvo una puntuación del 76%, mientras que Sonnet 4.5 alcanzó apenas un 18.5%. “En general, Opus 4.6 es mejor para encontrar información en contextos extensos, razonar después de absorber esos datos y ofrecer capacidades de razonamiento a nivel experto sustancialmente superiores”, señaló el equipo de Anthropic.
En la práctica, esta ventana de contexto ampliada permite a Claude Opus 4.6 gestionar de manera autónoma tareas prolongadas en herramientas como Excel. Esto es posible gracias a un procedimiento en el que el modelo planifica sus acciones antes de ejecutarlas. Dicha capacidad, conocida como “razonamiento preventivo”, le permite analizar la estructura completa de un libro de Excel y manejar funciones avanzadas como el formato condicional o la validación de datos, garantizando que las reglas lógicas se mantengan consistentes en todas las celdas.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/anthropic-quiere-dominar-el-mercado-de-los-agentes-de-ia-con-claude-opus-46-su-ultimo-modelo




