Bright Vision Technologies

Site Observability Engineer

Rol remoto de Site Observability Engineer con fit claro de ubicación del candidato.

Publicado5 jul 2026

Países elegibles1 país aceptado

Señal de senioritySenior

Modelo de trabajoRemoto

Ubicaciones aceptadas para candidatos

Estados Unidos

CI/CD Java Python

Puedo aplicar realmente?Revisa la lista de países

Las ubicaciones aceptadas para candidatos están listadas (1).

Actualidad de la fuente5 jul 2026

Fit de ubicación1 país aceptado

Match de stackCI/CD, Java

Camino de aplicaciónSitio de la empresa

Resumen de fit de MiraPor qué vale revisar este rol

Fit de ubicación1 país aceptadoAgrega tu país

Match de stackAgrega skills al perfil para compararCI/CD, Java

Señal de senioritySeniorDefine tu nivel para una revisión más precisa.

Preparación para aplicarSitio de la empresaLa aplicación continúa en el sitio de la empresa.

Aplicación

Aplicar en el sitio de la empresa

Aplicación externa

Aplicando aSite Observability EngineerBright Vision Technologies

Fit de país1 país aceptado

Camino de aplicaciónSitio de la empresa

WithMiraGuarda o suscríbete antes de salir

Aplicación de la empresa

WithMira mantiene este rol para descubrimiento. La aplicación continúa en el sitio de la empresa.

Aplicar en el sitio de la empresa

Guardar rol

Resumen del rol

Site Observability Engineer

Requisitos y responsabilidades

Contenido del rol extraído en secciones para revisar más rápido.

Job Title: Site Observability Engineer

Design and operate enterprise-grade observability platforms covering metrics, logs, traces, events, and synthetic monitoring.
Architect Prometheus / Thanos / Mimir, Grafana, Loki, Tempo, OpenTelemetry, and Datadog deployments for high availability and scale.
Develop standards for service instrumentation, including OpenTelemetry adoption, metric naming, label cardinality, and structured logging conventions.
Define and enforce SLOs, SLIs, and error budgets, and build the dashboards and alerts that operationalize them.
Build alerting strategies that minimize noise, surface actionable signals, and integrate cleanly with on-call workflows in PagerDuty, Opsgenie, or similar tools.
Operate large-scale time-series and log storage platforms, balancing retention, query performance, and cost.
Design distributed tracing pipelines and help teams use traces to diagnose latency and reliability issues.
Develop self-service tooling, paved-road libraries, and templates that make adoption of observability standards easy for product teams.
Drive cost management and label-cardinality discipline across the observability estate.
Lead incident response readiness improvements through better dashboards, alerting hygiene, and post-incident analysis tooling.
Partner with SRE and platform teams to integrate observability into deployment pipelines, canary analysis, and progressive delivery workflows.
Evaluate and recommend observability vendors and open-source tools based on cost, capability, and operational maturity.
Mentor engineering teams on observability fundamentals, debugging techniques, and SLO-driven operations.
Maintain documentation, onboarding guides, and runbooks for the observability platform.

Job Title: Site Observability Engineer

Bachelor’s degree in Computer Science or a related field.
Five or more years of experience in SRE, platform engineering, or observability roles.
Deep hands-on experience with Prometheus, Grafana, and at least one major commercial observability platform such as Datadog, New Relic, or Splunk.
Strong understanding of OpenTelemetry, distributed tracing, and structured logging.
Proficiency in at least one general-purpose language such as Go, Python, or Java.
Experience operating high-cardinality, high-throughput metrics and log pipelines.
Strong understanding of SLOs, error budgets, and SRE principles.
Experience integrating observability with CI/CD and incident management tooling.
Solid grasp of Linux internals, networking, and container platforms.
Excellent communication and collaboration skills.