SRE (Site Reliability Engineer) PL – AWS/GCP

SysMap Solutions • Remote, Remote • Posted May 22, 2026

Position Overview

Responsabilidades

  • Garantir a disponibilidade e confiabilidade dos sistemas em produção;
  • Implementar e manter soluções de monitoramento, observabilidade e alertas;
  • Atuar na resposta a incidentes, análise de causa raiz (RCA) e planos de ação;
  • Automatizar tarefas operacionais e processos repetitivos (Infraestrutura como Código);
  • Trabalhar com pipelines de CI/CD para deploy contínuo e seguro;
  • Gerenciar e otimizar ambientes em cloud (AWS e GCP);
  • Implementar práticas de resiliência, escalabilidade e tolerância a falhas;
  • Definir e acompanhar SLIs, SLOs e SLAs;
  • Apoiar times de desenvolvimento na construção de aplicações mais resilientes;
  • Realizar capacity planning e otimização de custos (FinOps básico);
  • Documentar processos, arquiteturas e playbooks operacionais.

Requisitos e qualificações

  • Experiência com ambientes cloud, especialmente AWS e/...