Akamai Technologies

Senior II Site Reliability Engineer

Rol remoto de Site Reliability Engineer con fit claro de ubicación del candidato.

Publicado4 jul 2026

Países elegibles2 países aceptados

Señal de senioritySenior

Modelo de trabajoRemoto

Ubicaciones aceptadas para candidatos

CanadáPolonia

Puedo aplicar realmente?Revisa la lista de países

Las ubicaciones aceptadas para candidatos están listadas (2).

Actualidad de la fuente4 jul 2026

Fit de ubicación2 países aceptados

Match de stackKubernetes, Python

Camino de aplicaciónSitio de la empresa

Resumen de fit de MiraPor qué vale revisar este rol

Fit de ubicación2 países aceptadosAgrega tu país

Match de stackAgrega skills al perfil para compararKubernetes, Python

Señal de senioritySeniorDefine tu nivel para una revisión más precisa.

Preparación para aplicarSitio de la empresaLa aplicación continúa en el sitio de la empresa.

Aplicación

Aplicar en el sitio de la empresa

Aplicación externa

Aplicando aSenior II Site Reliability EngineerAkamai Technologies

Fit de país2 países aceptados

Camino de aplicaciónSitio de la empresa

WithMiraGuarda o suscríbete antes de salir

Aplicación de la empresa

WithMira mantiene este rol para descubrimiento. La aplicación continúa en el sitio de la empresa.

Resumen del rol

Contenido del rol extraído en secciones para revisar más rápido.

Owning the SRE infrastructure lifecycle from design reviews and pre-rollout readiness assessments through production sign-off and ongoing reliability management
Designing and implementing frameworks that reflect customer experience for load balancing services and driving action when error budgets are at risk
Building and maintaining observability pipelines from load-balancing components and system-level sources to dashboards that enable rapid incident triage
Leading technical incident response for complex NB/NLB failures, acting as the technical commander and driving root cause analysis and preventive follow-through
Developing and automating safe deployment workflows for phased releases, including bake-period monitoring, feature flag management, and validation across global datacenter rollouts
Reviewing design documents, product-requirement documents and producing actionable SRE input on operational risks, capacity implications, Day-2 concerns, and product strategy gaps
Building automation and tooling using Python or Go that reduces operational toil and improves team-wide operational capability

8+ years of experience in SRE, infrastructure engineering, or platform engineering, working with large-scale distributed systems
Demonstrate deep expertise with Linux networking fundamentals and diagnosing at the packet level using tcpdump, netstat, and similar tools
Have hands-on experience with L4/L7 load balancing technologies covering configuration, health checking, high availability, and failure modes at scale
Show a track record of defining SLO/SLI frameworks, building observability platforms from scratch, and running incident management processes at scale
Demonstrate expertise in Kubernetes and containerization at scale including workload scheduling, networking, resource management, and operating stateful or network-intensive workloads in a cluster environment
Build automation and tooling using Python or Go, with infrastructure-as-code experience (SaltStack, Ansible, or Terraform) and deployment safety instincts

Roles similares