Claude Sonnet 4.5: ¿El clon de Slack en 30 horas es real o solo marketing de IA?

Anthropic, la empresa detrás del modelo de lenguaje Claude, ha lanzado su última versión, Claude Sonnet 4.5, con una promesa audaz: la capacidad de clonar un servicio como Slack en tan solo 30 horas. Según la compañía, el modelo generó 11.000 líneas de código de forma autónoma, sin supervisión humana. Esto ha generado un gran revuelo en la comunidad tecnológica, pero ¿qué tan real es esta afirmación?

La promesa de Anthropic: Un “jefe de gabinete” de la IA

Anthropic describe a Claude Sonnet 4.5 como el “mejor modelo del mundo para agentes, programación y uso de ordenadores”. Scott White, responsable de producto, incluso lo compara con un “jefe de gabinete”, capaz de coordinar agendas, analizar datos y redactar informes. Dianne Penn, por su parte, afirma utilizarlo para tareas como la búsqueda de candidatos en LinkedIn y la creación de hojas de cálculo.

La realidad según los desarrolladores: Código bonito, pero inútil

Si bien las demostraciones de Anthropic suenan impresionantes, la experiencia de los desarrolladores es bastante diferente. Miguel Ángel Durán, conocido como @midudev, compartió su experiencia en redes sociales: Claude Sonnet 4.5 refactorizó su proyecto, generando 14 archivos nuevos y modificando 1.500 líneas de código, aplicando una arquitectura limpia. Sin embargo, al final, “nada funcionaba”.

Otros desarrolladores han reportado problemas similares: Claude Sonnet 4.5 genera miles de líneas de código con una estructura impecable, pero que simplemente no se ejecutan o colapsan al compilarse. En resumen, código que parece profesional, pero que es funcionalmente inservible sin una intervención humana significativa.

La batalla por la automatización del código

Anthropic, OpenAI y Google se encuentran en una carrera por dominar el campo de los agentes autónomos y las herramientas de programación basadas en IA. El potencial de ingresos en licencias empresariales es enorme, lo que justifica la inversión y la competencia feroz. Sin embargo, la brecha entre las promesas de marketing y la realidad técnica sigue siendo un desafío importante.

Infraestructura extra: ¿Reconociendo el problema?

Anthropic parece ser consciente de las limitaciones de su modelo. Claude Sonnet 4.5 se lanza con una infraestructura adicional diseñada para construir agentes, incluyendo máquinas virtuales, gestión de memoria, gestión de contexto y soporte multiagente. Esto sugiere que, incluso con los modelos más avanzados, los desarrolladores necesitan herramientas adicionales para garantizar que los agentes programen de manera confiable.

Conclusión: Promesas vs. Realidad

La historia de Claude Sonnet 4.5 y su supuesta capacidad para clonar Slack en 30 horas es un ejemplo perfecto de la brecha entre el marketing y la realidad técnica en el mundo de la IA. Si bien los modelos de lenguaje han avanzado enormemente en la generación de código que *parece* profesional, todavía fallan en la tarea crucial de generar código que realmente *funcione* sin supervisión humana.

La pregunta clave sigue siendo: ¿cuándo veremos una IA capaz de generar código funcional por sí sola? Anthropic espera que su combinación de un modelo potente e infraestructura adicional sea la solución. Hasta entonces, es importante tomar estas afirmaciones con pinzas y esperar pruebas concretas y código verificable.

Fuente: Xataka