Resumen del rol

Platform Operations Engineer (all genders)

Requisitos y responsabilidades

Contenido del rol extraído en secciones para revisar más rápido.

wie du etwas bewirkst

  • Du führst Software-Updates, Patches und Bugfixes in Kundenumgebungen aus – sowohl in Cloud-, On-Premise- als auch in OT-Infrastrukturen
  • Du betreibst und wartest Kundensysteme und stellst einen stabilen und sicheren Tagesbetrieb sicher
  • Du trägst zum 24/7-Betrieb bei, indem du an Bereitschaftsdiensten teilnimmst und eine schnelle Reaktionszeit im Falle von Incidents sicherstellst
  • Du unterstützt Kunden bei Rollouts, Upgrades und operativen Incidents – auch außerhalb der regulären Geschäftszeiten, wenn erforderlich
  • Du arbeitest direkt mit Kunden zusammen, um ihre Cloud-Kundenumgebungen (Kubernetes, meist Single-Tenant pro Kunde) sowie On-Premise- und OT-Landschaften zu verstehen und passende Betriebsmodelle zu definieren
  • Du analysierst operative Probleme und koordinierst Troubleshooting gemeinsam mit Development, SRE und Security Teams
  • Du dokumentierst kundenspezifische Setups, operative Prozesse und Deployment-Verfahren
  • Du trägst dazu bei, Deployment- und Betriebsprozesse kundenübergreifend zu verbessern und zu standardisieren
  • Du unterstützt interne Teams, indem du Feedback aus dem realen Kundenbetrieb in Produkt- und Engineering-Entscheidungen einbringst

dein profil

  • Du hast starke Erfahrung im Betrieb komplexer Cloud-Applikationen und weißt, wie man Services unter realen Bedingungen zuverlässig betreibtDu betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-ModesDu hast praktische Erfahrung mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity)Du kennst moderne Betriebsmodelle, wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks)Du hast Erfahrung mit Infrastructure-as-Code-Tools (Terraform)Du arbeitest gerne hands-on operativ - von Deployments bis zum Troubleshooting in ProduktionsumgebungenDu verfügst über gute Kenntnisse in grundlegenden Security-Konzepten
  • Du betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-Modes
  • Du hast praktische Erfahrung mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity)
  • Du kennst moderne Betriebsmodelle, wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks)
  • Du hast Erfahrung mit Infrastructure-as-Code-Tools (Terraform)
  • Du arbeitest gerne hands-on operativ - von Deployments bis zum Troubleshooting in Produktionsumgebungen
  • Du verfügst über gute Kenntnisse in grundlegenden Security-Konzepten
  • Du arbeitest gerne eng mit Kunden zusammen und kannst technische Themen klar und pragmatisch erklären
  • Du hast Erfahrung mit Monitoring- und Observability-Plattformen (z. B. Datadog, Grafana oder vergleichbar)
  • Du bist bereit und in der Lage, zum 24/7-Betrieb durch Bereitschaftsdienste im Rahmen einer geteilten Team-Rotation beizutragen
  • Du bist strukturiert, zuverlässig und übernimmst Verantwortung für operative Aufgaben
  • Du arbeitest gut mit Software-Entwicklern zusammen und kannst operative Anforderungen in technische Requirements übersetzen
  • Du bist mit Teilen unseres Tech Stacks vertraut oder traust dir zu, dich schnell einzuarbeiten
  • Du beherrschst Deutsch und Englisch fließend in Wort und Schrift

Details

  • Du betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-Modes
  • Du hast praktische Erfahrung mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity)
  • Du kennst moderne Betriebsmodelle, wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks)
  • Du hast Erfahrung mit Infrastructure-as-Code-Tools (Terraform)
  • Du arbeitest gerne hands-on operativ - von Deployments bis zum Troubleshooting in Produktionsumgebungen
  • Du verfügst über gute Kenntnisse in grundlegenden Security-Konzepten

wie wir software entwickeln

  • Klar definierte Verantwortung für Produktthemen und effiziente Koordination zwischen Squads und Customer Success
  • Strukturiertes Incident Management (Service wiederherstellen, klar kommunizieren, dann Ursachenanalyse)
  • Release-Prozesse mit pragmatischem Risikomanagement (sichere Änderungen, schnelle Rollbacks bei Bedarf)
  • Monitoring- und Alerting-Hygiene (signal over noise)
  • Umfassende Runbooks und Automatisierung zur langfristigen Reduzierung operativer Belastung

unser tech stack

  • Hybrid-Cloud und on-prem Umgebungen, einschließlich vom Kunden betriebener Infrastruktur
  • Containerisierte Anwendungen, orchestriert mit Kubernetes und Helm
  • Anwendung primär in Python und TypeScript
  • Standard Backing Services wie PostgreSQL, RabbitMQ, Redis
  • Cloudflare
  • Gitlab & Gitlab CI zur Verwaltung des Software-Delivery-Lifecycles
  • Mehrere Cloud-Anbieter
  • Terraform und Automatisierungs-Tooling zur Unterstützung von Deployments und Betrieb
  • Datadog (Monitoring, Alerting, Dashboards)
  • Linux-Systeme, VPN-Technologien

deine benefits

  • Passe den Arbeitsmodus an deinen Lifestyle an – fully remote (oder hybrid mit Office-Option
  • Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA)
  • State of the Art Technologie und moderner Tech Stack
  • Sehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz)
  • 30 Urlaubstage + 3 corporate holidays
  • Unterstützung deiner Gesundheit mit der Urban Sports Club Kooperation
  • ProfessionelleUnterstützung rund um mentales Wohlbefindenfür dich und deine Familie durch unseren Partner nilo
  • Flexible Nutzung eines monatlichen Mobilitätsbudgets (z.B. Jobrad, ÖPNV)
  • Zeit und Budget für individuelles Wachstum
  • Regelmäßige Tech & Growth Talks für internen Wissensaustausch
  • optionale betriebliche Altersvorsorge
  • Regelmäßige Company und Team Events
Roles similares

Mantén una lista de respaldo.

Ver stack
FocoPlatform EngineeringÁrea del rol
Señal de senioritySeniorNivel del candidato
StackAWS, Azure, GCPSkills principales
Ubicación39 países aceptadosElegibilidad

Stack

Usa estas tags para comparar roles remotos similares.

Elegibilidad de ubicación

Candidatos deberían aplicar solo cuando el país del perfil aparece aquí.

Flujo de contratación

WithMira muestra el rol y luego envía candidatos a la aplicación de la empresa.

1Revisa fit del rol, stack y elegibilidad de ubicación en WithMira.
2Abre la página de aplicación de la empresa desde el link rastreado.
3Guarda el rol o suscríbete a oportunidades similares antes de salir.
Aplicar en el sitio de la empresaSitio de la empresaAbrir link