
Funcionários da AWS em ação hoje de madrugada. Foto: Depositphotos.
A AWS acaba de informar que o problema que causou a grande interrupção nos seus serviços nessa madrugada já foi “totalmente mitigado”.
“O problema subjacente de DNS foi totalmente mitigado, e a maioria das operações dos serviços da AWS está funcionando normalmente agora”, disse o comunicado.
No entanto, “algumas solicitações podem ser limitadas” enquanto os trabalhos para uma resolução completa continuam e serviços como CloudTrail e Lambda “continuam processando um acúmulo de eventos”.
O AWS CloudTrail é um serviço que registra todas as ações realizadas dentro de uma conta da AWS, como quem acessou recursos e o que foi feito, ajudando no monitoramento e na segurança.
Já o AWS Lambda é um serviço de computação sem servidores que permite executar código automaticamente em resposta a eventos, como o envio de um arquivo para o S3 ou alterações em um banco de dados, sem precisar gerenciar servidores.
A AWS agrega ainda que embora a “maioria das operações já tenha se recuperado”, algumas regiões podem ainda apresentar “taxas de erro mais altas”.
Caso isso aconteça, os clientes são orientados a limpar os caches através das configurações de seus navegadores, a segunda recomendação mais clássica do pessoal de TI, depois de reiniciar o computador.
Na nota, a AWS não deu maiores explicações sobre o que pode ter acontecido, provavelmente porque ainda está tentando descobrir.
Mais cedo, a empresa tinha confirmado que a falha tinha sido na região US-EAST-1, um ponto tradicional de encrenca para a AWS, no qual nem sempre é fácil saber o que está acontecendo (veja mais abaixo).
Os problemas começaram a ser relatados pela 1h da manhã, no horário brasileiro.
O DownDetector informou que já recebeu 4 milhões de avisos de falha, mais do que o dobro dos 1,8 milhão que costumam vir em uma semana. Os problemas afetariam 500 empresas diferentes.
Entre os afetados, estavam serviços da própria Amazon, como Amazon.com, Prime Video e Alexa além de redes sociais como Snapchat e Facebook e os games Fortnite e Roblox.
REGIÃO PROBLEMA
Conhecedores da AWS já sabem. A região US-EAST-1, localizada na Virgínia do Norte, nos Estados Unidos, é a mais conhecida por registrar falhas e instabilidades entre todas as regiões da gigante de nuvem.
A US-EAST-1 foi a primeira região da AWS e concentra a maior quantidade de serviços e clientes, incluindo boa parte da infraestrutura interna da própria Amazon.
Por hospedar tantos serviços e contas, é a região com a arquitetura mais complexa e sujeita a efeitos em cascata quando algo dá errado.
Muitos sistemas, inclusive de outras regiões, ainda têm dependências críticas em recursos da US-EAST-1 (como autenticação, roteamento ou serviços centrais).