Estamos procurando um SRE para garantir a estabilidade e a performance de nossos sistemas em cenários de alta demanda e ajudar a escalar a plataforma.
O seu dia a dia no Skeelo vai ser assim:
- Estruturar e otimizar a área de SRE e monitoramento, definindo processos, boas práticas e ferramentas.
- Desenvolver e manter monitoramento abrangente de toda a stack (infraestrutura, serviços, filas e performance).
- Atuar na identificação de causa raiz e resolução de incidentes, garantindo rápida recuperação dos serviços.
- Criar e evoluir automação e alertas, com detecção de anomalias e ações corretivas automatizadas.
- Garantir alta disponibilidade, performance e escalabilidade, preparando a infraestrutura para picos de demanda.
- Avaliar e evoluir o stack tecnológico, incluindo adoção de novas soluções (como IA) e, futuramente, apoio no desenvolvimento do time.
Para Isso Você Vai Precisar Ter