Global technology and innovation partner
Site Reliability Engineer
Location
New Zealand
Posted
3 days ago
Salary
$8K - $10K / month
Seniority
Senior
Job Description
Site Reliability Engineer
Handyman Interactive
• Helping migrate a self-managed Kubernetes cluster onto Amazon EKS. • Managing and improving AWS infrastructure defined in Terraform. • Supporting the migration of self-hosted Kafka onto Amazon managed services. • Ensuring platform stability, observability, and security during changes. • Collaborating closely with a senior internal team and taking initiative on tasks. • Documenting work for team maintenance.
Job Requirements
- Genuine hands-on EKS experience, not just clicking through a managed cluster.
- Comfort in someone else's infrastructure and respect for the existing setup.
- Strong AWS, with Terraform for infrastructure management.
- Ability to manage and migrate self-hosted systems to cloud-native, managed services.
- Solid Kafka knowledge, including moves to managed services such as Amazon MSK.
- Mid-senior level with a collaborative style that fits alongside an existing senior team.
- Clear communication skills for explaining technical trade-offs.
Related Guides
Related Categories
Related Job Pages
More DevOps Engineer Jobs
• Design and implement Infrastructure as Code practices • Build and improve observability (monitoring, logging, tracing) • Stabilize and evolve production environments • Support multi-environment deployments (Azure, private cloud, on-premise) • Improve platform reliability and system health • Participate in incident response and post-mortem analysis
Role Description Wir besetzen aktuell eine Rolle als DevOps Consultant bei einem führenden Anbieter von IT-Consulting, Infrastruktur und Managed-Services in Österreich. In dieser Position berätst du Kunden bei der Konzeption, Implementierung und Optimierung moderner DevOps-Architekturen und Automatisierungslösungen. Du analysierst Prozesse, identifizierst Potenziale und setzt skalierbare CI/CD- und Cloud-Lösungen um und agierst als technische Schnittstelle zwischen Development, Betrieb und Fachbereichen. - Beratung von Kunden bei der Konzeption, Implementierung und Optimierung moderner DevOps-Architekturen. - Analyse bestehender Entwicklungs- und Betriebsprozesse zur Identifikation von Optimierungspotenzialen. - Umsetzung und Weiterentwicklung skalierbarer und sicherer CI/CD-Pipelines und Cloud-Lösungen, insbesondere im Azure-Umfeld und mit Kubernetes. - Agieren als technische Schnittstelle zwischen Development-, Operations- und Fachbereichen. - Mitarbeit bei der Migration von On-Premise-Anwendungen in die Cloud. - Einführung und Etablierung von Automatisierungsstrategien (z.B. Infrastructure as Code, Konfigurationsmanagement). - Durchführung von Workshops und Schulungen für Kunden zur Vermittlung von DevOps-Best Practices. - Sicherstellung der Qualität und des Monitorings von implementierten DevOps-Lösungen. Qualifications - Mehrjährige Berufserfahrung als DevOps Engineer, Consultant oder Cloud Engineer mit fundierten Kenntnissen klassischer DevOps-Prinzipien und -Methoden. - Ausgeprägte Technologie-Expertise in mindestens einer Programmiersprache (C#, Python, JavaScript/TypeScript oder Java) sowie praktische Erfahrung mit Automatisierung, CI/CD und modernen Software-Deployments, idealerweise mit Azure und Kubernetes. - Eine strukturierte, analytische Arbeitsweise, ausgeprägte Beratungskompetenz und sehr gute Deutsch- sowie gute Englischkenntnisse in Wort und Schrift. - Kenntnisse in Azure DevOps, Jenkins, SAP-Anbindungen und Systemintegrationen sind ein Plus. Remote Work Policy In dieser Rolle kannst du fully remote (innerhalb Österreichs) arbeiten. Solltest Du für diese Rolle umziehen oder reisen, dann werden Deine Relocation- bzw. Reisekosten natürlich übernommen. Benefits - Attraktives Gehaltspaket bis zu 100k€ zzgl. Bonus. - Firmenfahrzeug (auch zur Privatnutzung) ab dem 3. Monat. - Bike-Leasing für ein topmodernes Firmenrad. - Optionale 4-Tage-Woche für mehr Work-Life-Balance. - Sportzuschuss für Fitnessstudio, Alpenverein oder Sportverein. - Flexibles Remote Setup mit viel Raum für individuelle Flexibilität & hoher Mitarbeiterzufriedenheit (Kununu Top-Arbeitgeber). Next Steps Wenn Du Dich hier bewirbst, dann schicken wir Dir zusätzliche Infos zum Unternehmen, zur Rolle und zum Gehalt, um Deinen Entscheidungsprozess zu unterstützen. Wenn Du weiterhin interessiert bist, laden wir Dich zu einem ersten Gespräch ein.
• Aufbau, Betrieb und Weiterentwicklung unserer Cloud-Infrastruktur mit Infrastructure as Code, insbesondere mit Terraform • Gestaltung und Betrieb sicherer CI/CD-Pipelines inklusive automatisierter Security-Tests wie SAST, DAST, SCA und Secret Scanning • Härtung der Plattform durch Container-Security, Netzwerksegmentierung, Zero-Trust-Prinzipien und professionelles Secrets Management • Verantwortung für Vulnerability Management, also Identifikation, Priorisierung und Patching von Schwachstellen • Weiterentwicklung von Monitoring, Logging und Alerting inklusive Observability- und SIEM-Integration • Mitarbeit in Incident-Response- und On-Call-Prozessen sowie Förderung einer belastbaren Post-Mortem-Kultur • Steuerung und Weiterentwicklung von Identity- und Access-Management nach dem Least-Privilege-Prinzip • Beratung und Enablement der Entwicklungsteams in sicherer Softwareentwicklung und DevSecOps-Prinzipien • Unterstützung bei DSGVO-, Datenschutz- und Audit-Anforderungen, insbesondere im Kontext von Fahrgastdaten und regulatorischen Vorgaben • Kontinuierliche Verbesserung von Recovery- und Backup-Strategien
Site Reliability Engineer
AccelaMarket-leading solutions that empower governments to build thriving communities, grow businesses and protect citizens.
• Contribute to the operation, maintenance, and continuous improvement of Accela's production cloud environments. • Support platform modernization initiatives, including containerization, cloud-native technologies, and automation efforts. • Monitor platform health, availability, performance, and capacity using modern observability and monitoring tools. • Participate in incident response activities, troubleshooting production issues and contributing to Root Cause Analysis efforts. • Develop and maintain automation, tooling, and scripts that improve reliability, scalability, deployment efficiency, and operational effectiveness. • Support the implementation and monitoring of service level objectives (SLOs), service level agreements (SLAs), and operational metrics. • Partner with Development, DevOps, Database Engineering, and Security teams to identify and resolve reliability, performance, and scalability challenges. • Assist with platform deployments, operational readiness reviews, and change management activities. • Contribute to observability initiatives through monitoring, logging, metrics collection, and distributed tracing. • Support compliance-related operational activities associated with SOC 2, HIPAA, FedRAMP, StateRAMP, and PCI-DSS environments. • Participate in post-incident reviews and contribute to corrective and preventive actions that improve platform stability.



