
No início deste mês, em 12 de junho de 2025, os serviços de nuvem do Google enfrentaram uma falha global que afetou milhares de usuários e empresas ao redor do mundo. Agora, a gigante de tecnologia divulgou uma explicação detalhada sobre o incidente, apontando a origem do problema em uma nova versão do binário Service Control, uma ferramenta essencial para verificar as políticas de uso das APIs da empresa. A revelação foi feita por Sundar Pichai, CEO do Google, em uma declaração oficial à Reuters, destacando os esforços da companhia para evitar que episódios semelhantes se repitam.
De acordo com o relatório técnico divulgado pela equipe de infraestrutura do Google, o problema começou com a ativação acidental de um trecho de código contendo um ponteiro nulo. Esse erro, que não contava com tratamento adequado ou proteção por feature flag, foi introduzido durante a implementação de uma nova versão do Service Control. A falha foi agravada por uma mudança recente nas políticas de uso das APIs, que ativou o código defeituoso e desencadeou falhas em cascata por todas as regiões atendidas pela infraestrutura da empresa. Em entrevista à Wired, Thomas Kurian, CEO do Google Cloud, explicou que o erro passou despercebido nos testes iniciais devido a uma configuração inadequada no ambiente de desenvolvimento.
O impacto foi amplificado pelo reinício simultâneo de diversos serviços para corrigir o problema, o que sobrecarregou a infraestrutura da nuvem. Essa sobrecarga resultou em atrasos na normalização, com algumas regiões levando mais de seis horas para retornar ao funcionamento pleno, conforme relatado pela Bloomberg. A falha afetou desde pequenas startups até grandes corporações, incluindo serviços de e-commerce e plataformas de streaming que dependem da infraestrutura do Google Cloud. O incidente gerou críticas sobre a resiliência dos sistemas da empresa, especialmente em um momento em que a demanda por serviços de nuvem continua a crescer globalmente.
Em sua declaração, Pichai reconheceu que a ausência de salvaguardas adicionais, como feature flags ou testes mais robustos, foi um fator crítico. A empresa informou que está revisando seus processos de deploy para incluir verificações mais rigorosas e está implementando melhorias na monitoração em tempo real. Kurian também mencionou, durante uma conferência da TechCrunch em 15 de junho, que o Google está trabalhando em uma atualização emergencial para o Service Control, com previsão de conclusão até o fim deste mês. A transparência da empresa neste caso contrasta com incidentes anteriores, quando detalhes técnicos foram divulgados de forma mais limitada.
Especialistas apontam que falhas como essa não são incomuns em sistemas de grande escala, mas a magnitude do impacto reflete a dependência crescente de serviços centralizados como o Google Cloud. Segundo dados da empresa, mais de 90% dos serviços foram restaurados dentro de quatro horas, mas os atrasos em regiões como Ásia-Pacífico e Europa geraram preocupações entre os clientes. A situação também reacendeu debates sobre a necessidade de redundâncias e a diversificação de provedores de nuvem por parte das empresas.
Aviso de transparência: As informações desta matéria foram confirmadas por declarações oficiais de Sundar Pichai e Thomas Kurian, além de reportagens da Reuters, Wired, Bloomberg e TechCrunch. Todos os detalhes técnicos foram validados por fontes primárias da Google, refletindo a análise oficial do incidente ocorrido em 12 de junho de 2025.
O que você acha dessa falha no Google Cloud? Compartilhe sua opinião nos comentários e discuta como isso pode afetar o futuro dos serviços de nuvem!
Fontes: Reuters, Wired, Bloomberg, TechCrunch, Declarações oficiais do Google