Berkeley Research Group

Site Reliability Engineer

Rol remoto de Site Reliability Engineering con fit claro de ubicación del candidato.

Publicado2 jul 2026

Países elegibles1 país aceptado

Señal de senioritySenior

Modelo de trabajoRemoto

Ubicaciones aceptadas para candidatos

Estados Unidos

Puedo aplicar realmente?Revisa la lista de países

Las ubicaciones aceptadas para candidatos están listadas (1).

Actualidad de la fuente2 jul 2026

Fit de ubicación1 país aceptado

Match de stackAWS, Azure

Camino de aplicaciónSitio de la empresa

Resumen de fit de MiraPor qué vale revisar este rol

Fit de ubicación1 país aceptadoAgrega tu país

Match de stackAgrega skills al perfil para compararAWS, Azure

Señal de senioritySeniorDefine tu nivel para una revisión más precisa.

Preparación para aplicarSitio de la empresaLa aplicación continúa en el sitio de la empresa.

Aplicación

Aplicar en el sitio de la empresa

Aplicación externa

Aplicando aSite Reliability EngineerBerkeley Research Group

Fit de país1 país aceptado

Camino de aplicaciónSitio de la empresa

WithMiraGuarda o suscríbete antes de salir

Aplicación de la empresa

WithMira mantiene este rol para descubrimiento. La aplicación continúa en el sitio de la empresa.

Resumen del rol

Contenido del rol extraído en secciones para revisar más rápido.

Design, implement, and maintain scalable and reliable systems in cloud environments such as Azure Cloud Services.
Experience with CI/CD Platforms (GitHub Actions, GitLab CI)
Provide operational support for full-stack software applications.
Increase system resilience with expert-level coding, bulletproof release, and change management skills.
Develop service-level indicators and objectives to automate release validation.
Improve automation and increase the system’s self-healing capability.
Collect operating system data and report performance metrics to stakeholders.
Ensure security best practices are followed in cloud infrastructure and application deployments.
Manage cloud and database system maintenance, debugging production issues as they arise.
Improve reliability, quality, and time-to-market of our suite of software solutions.
Partner with security and product teams to define and publish policies, processes, and playbooks to facilitate rapid and effective handling of alerts and incidents.
Lead incident management processes; respond to outages and service disruptions promptly.

Bachelor’s degree in computer science or similar field.
Five years’ experience as a site reliability engineer or similar role.
Strong programming skills (Golang, Ruby, Python, or similar)
Proven ability to diagnose and monitor performance and reliability issues across the stack.
Expertise in Kubernetes.
Relevant industry certifications, such as through the Site Reliability Engineering (SRE) Foundation.
Proven experience working with cloud-native infrastructure (Azure Cloud Services, AWS, or GCP).
Experience working with observability and incident management tools (Datadog, OpsGenie, PagerDuty).
Experience scripting operating system tasks with Infrastructure as Code.
Impeccable communication skills.
Ability to problem-solve in a fast-paced, high-stakes environment.

Roles similares