Ihre Bewerbungsdaten
Egal, ob Sie eine Stelle für den Berufseinstieg suchen oder bereits Berufserfahrung mitbringen:
Bei uns werden Sie fündig!
Informationen zur Stelle
Stelle:
IT Site Reliability Engineer (m/w/x)
Unternehmen:
ÖBB-Business Competence Center GmbH
Anforderungen:
hast ein abgeschlossenes IT-Studium (z. B. Informatik, Wirtschaftsinformatik o. Ä.) oder eine vergleichbare Qualifikation.
verfügst über mehrjährige Erfahrung im Bereich SRE, DevOps, Cloud Engineering oder Systembetrieb und bringst fundiertes Debugging-Know-how mit.
hast Erfahrung in der agilen Zusammenarbeit (Scrum/Kanban) gesammelt.
bringst idealerweise Erfahrung mit Azure oder vergleichbaren Cloud Providern (AWS, GCP), gutes Gesamtverständnis von Kubernetes, Infrastructure as Code (z.B. Terraform), sowie GitOps (ArgoCD) mit.
kommunizierst offen, übernimmst gerne Verantwortung und arbeitest service- sowie kund;innenorientiert.
hast ein “Engineering Mindset” und findest nachhaltige Lösungen für Infrastrukturprobleme.
Aufgaben:
Als Site Reliability Engineer (SRE) (m/w/x) gestaltest du den stabilen, skalierbaren und hochverfügbaren Betrieb der Rail Cargo Plattform – einer der wichtigsten digitalen Lösungen der ÖBB. Gemeinsam mit unseren DevOps‑Teams betreibst du hybride Cloud‑Infrastrukturen (Azure + Rechenzentren), optimierst unsere Services und erarbeitest neue Standards für den langfristigen Betrieb der Plattform.
überwachst und analysierst unsere Anwendungen und Systeme – sowohl on-prem als auch in der Cloud. identifizierst Engpässe, Performance-Probleme und Optimierungspotenziale. stellst proaktiv Stabilität, Verfügbarkeit und Supportfähigkeit sicher (inklusive Rufbereitschaft im Rotationsmodell). übernimmst die Fehlersuche und Ursachenanalyse (Debugging) und sorgst für die kontinuierliche Verbesserung der Anwendungen. arbeitest eng mit unseren Entwickler:innenteams zusammen, um einen optimalen und skalierbaren Betrieb zu gewährleisten. planst und führst Upgrades, Deployments und Migrationsaktivitäten durch. entwickelst und implementierst Automatisierungslösungen zur Unterstützung moderner DevOps-Praktiken (z. B. Continuous Delivery, GitOps). erstellst und führst Wiederherstellungs- und Notfalltests durch, um die Resilienz unserer Systeme sicherzustellen.