SRE (Site Reliability Engineer) PL – AWS/GCP
SysMap Solutions • Remote, Remote • Posted May 22, 2026
Position Overview
Responsabilidades
- Garantir a disponibilidade e confiabilidade dos sistemas em produção;
- Implementar e manter soluções de monitoramento, observabilidade e alertas;
- Atuar na resposta a incidentes, análise de causa raiz (RCA) e planos de ação;
- Automatizar tarefas operacionais e processos repetitivos (Infraestrutura como Código);
- Trabalhar com pipelines de CI/CD para deploy contínuo e seguro;
- Gerenciar e otimizar ambientes em cloud (AWS e GCP);
- Implementar práticas de resiliência, escalabilidade e tolerância a falhas;
- Definir e acompanhar SLIs, SLOs e SLAs;
- Apoiar times de desenvolvimento na construção de aplicações mais resilientes;
- Realizar capacity planning e otimização de custos (FinOps básico);
- Documentar processos, arquiteturas e playbooks operacionais.
Requisitos e qualificações
- Experiência com ambientes cloud, especialmente AWS e/...