A Amazon Web Services passou por uma grande interrupção na última terça-feira, 28. Foto: Divulgação.
A Amazon Web Services passou por uma grande interrupção na última terça-feira, 28. A falha de cinco horas afetou inclusive o próprio painel de status da AWS, pois os ícones de aviso sobre a disponibilidade da empresa estavam hospedados no lado quebrado da nuvem.
Durante a interrupção, o serviço de armazenamento S3 da Amazon enfrentou problemas generalizados que tornaram serviços parcial ou totalmente falhos em sites, aplicativos e dispositivos. A oferta da AWS fornece hospedagem de imagens para diversos sites, além de hospedar sites inteiros e backends de aplicativos, incluindo o Nest.
Entre os sites e serviços afetados estavam Quora, Business Insider, Giphy, Imgur, Twitch.tv, Razer, Zendesk, Coursera, Mailchimp, Citrix, Expedia, Flipboard e Yahoo! Mail.
O Amazon S3 é usado por cerca de 148.213 sites e 121.761 domínios únicos, de acordo com dados rastreados pela SimilarTech. A popularidade do serviço como um host de conteúdo se concentra especificamente nos Estados Unidos.
A empresa de monitoramento web Apica detalhou os números sobre como o tempo de inatividade da AWS afetou os sites de varejo.
De acordo com a companhia, 54 dos 100 maiores varejistas de internet foram afetados com uma queda de 20% ou mais no desempenho, enquanto três sites caíram completamente: Express, Lululemon e One Kings Lane.
Com a falha, sites que em média exigem poucos segundos para carregar levaram mais de 30 segundos. O tempo de carregamento da Disney Store, por exemplo, subiu 1.165%, enquanto a Nike Store aumentou o tempo em 642%.
Para o Business Insider, o incidente desta semana destacou um pensamento assustador para as empresas de internet: que uma única empresa e sua tecnologia são responsáveis por grande parte das receitas a serem feitas online.
Durante a interrupção, as empresas do S&P 500 perderam US$ 150 milhões, segundo análise da Cyence.
No final da tarde desta quinta-feira, 02, a Amazon publicou um post para explicar a falha. A empresa responsabilizou um funcionário que entrou um comando incorreto, fazendo com que um conjunto maior de servidores do que era esperado fosse removido do serviço.
Esses servidores ofereciam suporte a outros produtos e serviços da AWS e causaram uma reação em cadeia, o que significa que alguns sistemas críticos tiveram que ser reiniciados. Enquanto eles reiniciavam, o S3 da Amazon não funcionou normalmente.
*Editado às 17h22min para incluir a explicação da Amazon.