Facebook culpa erro de configuração na falha global dessa semana!

O Facebook se desculpou por uma grande interrupção global que deixou os usuários impossibilitados de acessar a as redes sociais da empresa por horas. A empresa acabou culpando um erro de configuração pela falha global ocorrida nas redes sociais do Facebook.

A interrupção começou próximo ao meio dia no orário de Brasília, na manhã de segunda-feira e durou até a noite do mesmo dia. A falha acabou afetando não apenas o Facebook e o Messenger, mas também o Instagram e o WhatsApp.

A recuperação das redes sociais foi um pouco difícil. Os engenheiros do Facebook encontraram dificuldade para acessar ferramentas internas que usavam a mesma infraestrutura de Internet. A equipe global foi deixada de lado por motivos semelhantes, aponta o site Info Security.

Segundo o site, o problema parece ter se originado de uma atualização dos registros do Border Gateway Protocol (BGP) da empresa. O BGP é fundamental para o funcionamento perfeito da Internet, permitindo que redes de endereços como o do Facebook anunciem sua presença para outras pessoas.

“É um mecanismo de troca de informações de roteamento entre sistemas autônomos (AS) na internet”, explicou Cloudflare em um blog técnico sobre o incidente.

Problemas que causaram a falha global nas redes sociais do Facebook

facebook-culpa-erro-de-configuracao-na-falha-global-dessa-semana

Um dos comentários de técnicos no blog do Cloudflare disse: “Os grandes roteadores que fazem a Internet funcionar têm listas enormes e constantemente atualizadas das rotas possíveis que podem ser usadas para entregar todos os pacotes de rede aos seus destinos finais. Sem o BGP, os roteadores da Internet não saberiam o que fazer e a Internet não funcionaria. ”

No entanto, apesar de alguns comentaristas tenham especulado o crime, a causa da interrupção parece ser um erro humano, pelo menos é o que revelou o vice-presidente de infraestrutura do Facebook, Santosh Janardhan. Ele disse que nenhum dado do usuário foi comprometido e que a causa raiz do problema era uma “alteração de configuração defeituosa”.

Segundo o vice-presidente, as equipes de engenharia da empresa aprenderam que as alterações de configuração nos roteadores de backbone que coordenam o tráfego de rede entre os datacenters da empresa causaram problemas que interromperam essa comunicação.

Ainda segundo ele, “essa interrupção do tráfego de rede teve um efeito cascata na maneira como nossos datacenters se comunicam, interrompendo nossos serviços”. Ele apontou que entendem o impacto que interrupções como essas têm na vida das pessoas e da responsabilidade da empresa em mantê-las informadas sobre interrupções em nossos serviços.

Por último, disse: Pedimos desculpas a todos os afetados e estamos trabalhando para entender mais sobre o que aconteceu hoje para que possamos continuar a tornar nossa infraestrutura mais resiliente”.

Via: InfoSecurity

FONTE: Blog SempreUpdate
Por mais esta excelente publicação, agradecemos.