Bright Vision Technologies

Site Observability Engineer

Vaga remota de Site Observability Engineer com fit claro de localização do candidato.

Publicada5 de jul. de 2026

Países elegíveis1 país aceito

Sinal de senioridadeSenior

Modelo de trabalhoRemoto

Locais aceitos para candidatos

Estados Unidos

CI/CD Java Python

Posso mesmo aplicar?Confira a lista de países

Países aceitos para candidatos estão listados (1).

Atualidade da fonte5 de jul. de 2026

Fit de localização1 país aceito

Match de stackCI/CD, Java

Caminho de aplicaçãoSite da empresa

Resumo de fit da MiraPor que vale revisar esta vaga

Fit de localização1 país aceitoAdicione seu país

Match de stackAdicione skills ao perfil para compararCI/CD, Java

Sinal de senioridadeSeniorDefina seu nível para uma análise mais precisa.

Prontidão para aplicarSite da empresaA aplicação continua no site da empresa.

Aplicação

Aplicar no site da empresa

Aplicação externa

Aplicando paraSite Observability EngineerBright Vision Technologies

Fit de país1 país aceito

Caminho de aplicaçãoSite da empresa

WithMiraSalve ou assine antes de sair

Aplicação da empresa

O WithMira mantém esta vaga para descoberta. A aplicação continua no site da empresa.

Aplicar no site da empresa

Salvar vaga

Resumo da vaga

Site Observability Engineer

Requisitos e responsabilidades

Conteúdo da vaga extraído em seções para revisão mais rápida.

Job Title: Site Observability Engineer

Design and operate enterprise-grade observability platforms covering metrics, logs, traces, events, and synthetic monitoring.
Architect Prometheus / Thanos / Mimir, Grafana, Loki, Tempo, OpenTelemetry, and Datadog deployments for high availability and scale.
Develop standards for service instrumentation, including OpenTelemetry adoption, metric naming, label cardinality, and structured logging conventions.
Define and enforce SLOs, SLIs, and error budgets, and build the dashboards and alerts that operationalize them.
Build alerting strategies that minimize noise, surface actionable signals, and integrate cleanly with on-call workflows in PagerDuty, Opsgenie, or similar tools.
Operate large-scale time-series and log storage platforms, balancing retention, query performance, and cost.
Design distributed tracing pipelines and help teams use traces to diagnose latency and reliability issues.
Develop self-service tooling, paved-road libraries, and templates that make adoption of observability standards easy for product teams.
Drive cost management and label-cardinality discipline across the observability estate.
Lead incident response readiness improvements through better dashboards, alerting hygiene, and post-incident analysis tooling.
Partner with SRE and platform teams to integrate observability into deployment pipelines, canary analysis, and progressive delivery workflows.
Evaluate and recommend observability vendors and open-source tools based on cost, capability, and operational maturity.
Mentor engineering teams on observability fundamentals, debugging techniques, and SLO-driven operations.
Maintain documentation, onboarding guides, and runbooks for the observability platform.

Job Title: Site Observability Engineer

Bachelor’s degree in Computer Science or a related field.
Five or more years of experience in SRE, platform engineering, or observability roles.
Deep hands-on experience with Prometheus, Grafana, and at least one major commercial observability platform such as Datadog, New Relic, or Splunk.
Strong understanding of OpenTelemetry, distributed tracing, and structured logging.
Proficiency in at least one general-purpose language such as Go, Python, or Java.
Experience operating high-cardinality, high-throughput metrics and log pipelines.
Strong understanding of SLOs, error budgets, and SRE principles.
Experience integrating observability with CI/CD and incident management tooling.
Solid grasp of Linux internals, networking, and container platforms.
Excellent communication and collaboration skills.