Equinix
Senior Staff Engineer, SRE/DevOps, Product Software/ Ingénieur principal ou ingé
Rol remoto de Site Reliability Engineering con fit claro de ubicación del candidato.
Publicado13 jun 2026
Países elegibles2 países aceptados
Señal de senioritySenior
Modelo de trabajoRemoto
Ubicaciones aceptadas para candidatos
CanadáEstados Unidos
Resumen del rol
Senior Staff Engineer, SRE/DevOps, Product Software/ Ingénieur principal ou ingé
Requisitos y responsabilidades
Contenido del rol extraído en secciones para revisar más rápido.
Responsibilities
- Actively participate in the design, development, test, and operation of highly reliable services and software to model network entities and relationships that compose Equinix’s global network
- Provide technical guidance and collaborate with stakeholders to identify network data and use cases that can enrich the unified network model to solve critical business problems that increase network reliability, visibility, awareness, and the ability to plan
- Develop solutions that leverage data from the unified network model to provide insights that enhance product capabilities for customers, aid operations teams to troubleshoot customer escalations and planning maintenances, and inform capacity planning teams
- Facilitate cross-stakeholder discussions to ensure alignment on software requirements and design trade-offs, while considering performance, scalability, and reliability factors
- Follow a proactive and collaborative approach to working with cross-functional teams, ensuring seamless integration of unified network model into Equinix Brain with other domains and Network-As-A-Service (NaaS) initiatives
- Lead by example through direct contribution, and provide direction in establishing development and operational best practices and standard methodologies
- Participate in an on-call rotation
Qualifications
- 7+ years of experience developing distributed, scalable, highly available software services using Golang
- Background of working for SaaS, PaaS, IaaS, or cloud-based companies with prior experience of designing microservices and systems at scale with a focus on production readiness
- Experience with building software as a service, running services with 24x7 on-call rotations
- Proficient in data management systems and technologies: GCP Spanner, MongoDB, Redis, Neo4J
- Experience with containerization and orchestration technologies: Docker, Kubernetes, or other open-source alternatives
- Experience in working with network management protocols: gRPC, Netconf
- Solid understanding of networking concepts, protocols (e.g. ISIS, BGP, BMP, LLDP), and their applications
- Strong experience in building & operating highly reliable distributed systems
- Proficient in using continuous integration and continuous deployment technologies: Github Actions, ArgoCD
- Experience with public cloud (AWS, GCP, Azure) services and technologies
- Hands-on experience with observability stack (metrics, logs, traces) such as Grafana, Prometheus, Thanos
- Experience with agile software development practices including JIRA, peer reviews, Git, CI/CD
- Excellent problem-solving and analytical skills to troubleshoot and resolve distributed system issues
- Strong written and verbal communication skills to effectively convey findings, recommendations, and technical details to various stakeholders
- Bachelor's degree in computer science or related technical field
Preferred
- Master's degree or PhD in Computer Science or a related technical field
- Excellent coding skills in Golang
- Prior experience building a network model or digital twin
- Prior experience using AI to make real-time decisions (on the network)
Responsabilités
- Participer activement à la conception, au développement, à l’essai et à l’exploitation de services et de logiciels à grande fiabilité afin de modéliser les entités et relations réseau qui forment le réseau mondial d’Equinix
- Offrir des conseils techniques et collaborer avec des parties prenantes pour déterminer les données et cas d’utilisation susceptibles d’enrichir le modèle de réseau unifié. L’objectif étant de résoudre des problèmes critiques en vue d’augmenter la fiabilité, la visibilité et le taux de reconnaissance du réseau, ainsi que la capacité de planification
- Développer des solutions qui mettent à profit les données du modèle de réseau unifié afin d’améliorer les capacités de produit pour les clients. Ces solutions devront aussi aider les équipes opérationnelles à analyser les problèmes signalés par les clients et à planifier les activités de maintenance, ainsi que les équipes responsables de la planification des capacités
- Diriger des discussions multipartites pour assurer un consensus concernant les exigences et la conception du logiciel en tenant compte des critères de performance, d’évolutivité et de fiabilité
- Adopter une approche proactive et collaborative en travaillant avec des équipes multidisciplinaires afin d’assurer une intégration harmonieuse du modèle de réseau unifié dans Equinix Brain, d’autres domaines et initiatives de réseau-service (NaaS)
- Donner l’exemple par des contributions directes et fournir une orientation par l’établissement de pratiques exemplaires et de méthodologies normalisées en matière de développement et de fonctionnement
- Participer à un système d’astreinte
Qualifications
- Au moins sept (7) ans d’expérience dans le développement de services logiciels distribués, évolutifs et à très grande disponibilité, en utilisant Golang
- Expérience de travail dans une entreprise SaaS, PaaS, IaaS ou infonuagique, y compris de l’expérience à concevoir des microservices et systèmes à grande échelle, avec l’accent mis sur la préparation à la production
- Expérience à développer des logiciels-services, dont les services sont assurés par un système d’astreinte 24 heures sur 24, 7 jours sur 7
- Maîtrise des systèmes et technologies de gestion des données : GCP Spanner, MongoDB, Redis, Neo4J
- Expérience des technologies de conteneurisation et d’orchestration : Docker, Kubernetes ou d’autres options ouvertes
- Expérience à travailler avec des protocoles de gestion de réseaux : gRPC, Netconf
- Très bonne compréhension des concepts et protocoles de mise en réseau (p. ex. ISIS, BGP, BMP, LLDP) et de leurs applications
- Grande expérience à développer et à exploiter des systèmes distribués à grande fiabilité
- Maîtrise des technologies d'intégration continue et de déploiement continu : GitHub Actions, ArgoCD
- Expérience des services et technologies de nuage public (AWS, GCP, Azure)
- Expérience pratique des outils d’observabilité (mesures, journaux, traces), p. ex. Grafana, Prometheus, Thanos
- Expérience des pratiques agiles de développement logiciel, dont JIRA, des évaluations par les pairs, Git et CI/CD
- Excellentes compétences analytiques et de résolution de problèmes afin d’établir des diagnostics et de résoudre des problèmes propres aux systèmes distribués
- Très bonnes compétences de communication écrite et verbale afin de relayer efficacement des résultats, des recommandations et des détails techniques à diverses parties prenantes
- Baccalauréat en science informatique ou dans un domaine technique connexe
Atouts
- Maîtrise ou doctorat en science informatique ou dans un domaine technique connexe
- Excellentes compétences de codage avec Golang
- Expérience antérieure du développement d’un modèle réseau ou d’un jumeau numérique
- Expérience antérieure de l’utilisation de l’IA pour prendre des décisions en temps réel (concernant le réseau)
Roles similares
Mantén una lista de respaldo.
Stack
Usa estas tags para comparar roles remotos similares.
Elegibilidad de ubicación
Candidatos deberían aplicar solo cuando el país del perfil aparece aquí.
Tu perfilPaís no definidoInicia sesión para comparar tu país con este rol.
Flujo de contratación
WithMira muestra el rol y luego envía candidatos a la aplicación de la empresa.
1Revisa fit del rol, stack y elegibilidad de ubicación en WithMira.
2Abre la página de aplicación de la empresa desde el link rastreado.
3Guarda el rol o suscríbete a oportunidades similares antes de salir.