¡Hola, Agentes Geek! Noviembre de 2025 no fue el mejor mes para GitHub en términos de disponibilidad. La plataforma ha publicado su informe mensual, revelando que sufrieron tres incidentes separados que impactaron el rendimiento de varios servicios clave.
Incidente 1: Dependabot Atascado (17 de Noviembre)
El primer incidente ocurrió el 17 de noviembre entre las 16:52 y las 19:08 UTC. Dependabot, la herramienta de GitHub para mantener las dependencias de tus proyectos actualizadas, se topó con un límite de velocidad en el Registro de Contenedores de GitHub (GHCR). Esto provocó que aproximadamente el 57% de los trabajos de Dependabot no se completaran dentro del Service Level Objective (SLO).
La solución: GitHub redujo la velocidad a la que Dependabot iniciaba trabajos y aumentó el límite de velocidad en GHCR. Esto resolvió el problema. A futuro, están implementando nuevas herramientas de monitoreo y alertas para prevenir situaciones similares.
Incidente 2: Fallos en las Operaciones Git (18 de Noviembre)
Al día siguiente, el 18 de noviembre, entre las 20:30 y las 21:34 UTC, GitHub experimentó fallos en todas las operaciones Git. Esto afectó tanto las interacciones SSH y HTTP, como el acceso a archivos sin formato. Esto, por supuesto, impactó a todos los productos que dependen de operaciones Git.
La causa raíz: Un certificado TLS expirado utilizado para la comunicación interna entre servicios. Para solucionarlo, reemplazaron el certificado y reiniciaron los servicios afectados. Tras el reinicio, el servicio se recuperó por completo.
Medidas preventivas: Además de actualizar las alertas para cubrir la expiración de certificados, GitHub está auditando otros certificados en esa área para asegurar que tengan las alertas y la automatización correctas antes de que expiren. También están acelerando la automatización de todos los certificados gestionados manualmente.
Incidente 3: Copilot y el Modelo Claude Sonnet 4.5 (28 de Noviembre)
El último incidente tuvo lugar el 28 de noviembre, entre las 05:59 y las 08:24 UTC. Copilot, el asistente de programación de GitHub, experimentó una interrupción que afectó al modelo Claude Sonnet 4.5. Los usuarios que intentaron utilizar este modelo recibieron un error HTTP 400 indicando que no estaba disponible, hasta que seleccionaron un modelo alternativo. Otros modelos no se vieron afectados.
El problema: Una configuración incorrecta desplegada en un servicio interno, que listó erróneamente a Claude Sonnet 4.5 como no disponible. La solución fue revertir el cambio de configuración.
Mejoras a futuro: GitHub está trabajando para mejorar las salvaguardias en los despliegues entre servicios para prevenir incidentes similares.
En Resumen
Noviembre fue un mes movido para GitHub, con tres incidentes que afectaron a diferentes partes de la plataforma. Sin embargo, es importante destacar que la compañía compartió públicamente estos problemas y las medidas que están tomando para evitar que se repitan.
Leave a Comment