Tecsys Inc.
Ingénieur fiabilité des infrastructures
Rol remoto de Site Reliability Engineering con fit claro de ubicación del candidato.
Publicado20 jun 2026
Países elegibles1 país aceptado
Señal de seniorityMiddle
Modelo de trabajoRemoto
Ubicaciones aceptadas para candidatos
Canadá
Resumen del rol
Ingénieur fiabilité des infrastructures
Requisitos y responsabilidades
Contenido del rol extraído en secciones para revisar más rápido.
Vos responsabilités
- Collaborer avec d’autres équipes d’ingénierie pour soutenir les services avant leur mise en service à travers des activités telles que la consultation en conception de systèmes, le développement de plateformes et de cadres logiciels, la planification des capacités et les revues de lancement.
- Innover continuellement en identifiant les points faibles, en proposant des solutions créatives et en menant des initiatives qui simplifient, font évoluer et renforcent la plateforme.
- Maintenir les services une fois qu’ils sont en ligne en mesurant et en surveillant la disponibilité, la latence et l’état général du système.
- Assurer une observabilité optimisée : améliorer et élargir la surveillance et l’alerte à l’aide de Datadog; définir les SLO/SLI et créer des tableaux de bord exploitables qui génèrent des résultats de fiabilité.
- Développer et favoriser l’automatisation : améliorer les outils internes, les cadres IaC et les pipelines (Terraform, GitLab CI/CD) afin de réduire les interventions manuelles et permettre des systèmes d’auto-réparation.
- Faire évoluer les systèmes de façon durable par l’automatisation et en favorisant des changements qui améliorent la fiabilité et la rapidité.
- Mettre en pratique une gestion durable des incidents et des analyses post-incident sans reproche. Diriger les examens post-incident (RCA) et identifier les correctifs à long terme qui améliorent la stabilité, la fiabilité et l’expérience des développeurs.
- Mettre en œuvre la surveillance, la journalisation, l’alerte et le signalement des SLA.
- Créer et maintenir une documentation technique.
- Mettre en œuvre, maintenir et faire évoluer les meilleures pratiques SRE.
- Agir comme commandant d’incident lors des incidents; coordonner la réponse interéquipes, gérer les communications et assurer une restauration rapide des services.
Autres exigences :
- Rotation en cas d’escalade d’incidents
- Voyages occasionnels (visites trimestrielles sur les lieux, conférences - moins de 10 %)
Roles similares
Mantén una lista de respaldo.
Stack
Usa estas tags para comparar roles remotos similares.
Elegibilidad de ubicación
Candidatos deberían aplicar solo cuando el país del perfil aparece aquí.
Tu perfilPaís no definidoInicia sesión para comparar tu país con este rol.
Flujo de contratación
WithMira muestra el rol y luego envía candidatos a la aplicación de la empresa.
1Revisa fit del rol, stack y elegibilidad de ubicación en WithMira.
2Abre la página de aplicación de la empresa desde el link rastreado.
3Guarda el rol o suscríbete a oportunidades similares antes de salir.