La desafortunada historia de cómo un usuario de Fastly provocó la caída mundial de internet

0

Imagina que eres un usuario de alguna plataforma de servicios en la nube. Un día cualquiera tienes la necesidad de hacer algunos ajustes al sistema y tus acciones generan la caída mundial de internet. Sí, parece un historia de comedia/tragedia, pero fue lo que sucedió ayer cuando múltiples webs, incluyendo Amazon, Twitch, Reddit, Twitter y Spotify, por mencionar algunas, quedaron fuera de línea debido a un problema en el CDN de Fastly.

A través de un comunicado, Fastly explicó cómo es que una persona inocente desató la caída de internet. En primer lugar, es importante mencionar que el usuario involucrado no lo hizo intencionalmente. Jamás imaginó que sus acciones harían realidad un Apocalipsis —como si no fuera suficiente estar viviendo una pandemia—. Según Fastly, el pasado 12 de mayo desplegaron una actualización de software en su plataforma; el problema es que tenía un bug crítico no identificado.

Curiosamente, para activar el fallo era necesario que se cumplieran una serie de condiciones y ajustes específicos en la cuenta de cualquier usuario. El 8 de junio, una persona realizó cambios a la configuración de su servicio y, por mala suerte, eran exactamente los parámetros requeridos para disparar el bug. Fastly dice que el 85% de su red presentó problemas tras el desafortunado suceso, lo cual ocasionó la caída de múltiples servicios y webs de internet.

Experimentamos una interrupción global debido a un error de software no descubierto que surgió el 8 de junio. Fue provocado por un cambio en la configuración de un cliente.

La caída de internet era evitable

La buena noticia es que los ingenieros de la plataforma identificaron el fallo rápidamente y desplegaron una actualización para solucionarlo. En 49 minutos ya habían recuperado el 95% de su red. Evidentemente, Fastly está consciente de que esta situación se pudo haber evitado. Para que no se vuelva a repetir, están haciendo una investigación para saber por qué no identificaron el error durante el proceso de control de calidad de software.

“Aunque hubo condiciones específicas que desencadenaron esta interrupción, debimos haberlo anticipado”, menciona Fasly. Por supuesto, aprovecharon el espacio para ofrecer disculpas. No solo a sus clientes, también a los millones de internautas que se vieron afectados por la caída mundial de internet: “Pedimos disculpas a nuestros clientes y a aquellos que dependen de ellos por la interrupción. Agradecemos sinceramente a la comunidad por su apoyo”.