C

Comma Soft AG

Remote Jobs

1 open roleLatest: Apr 13, 2026, 4:01 PM UTC
Post Date
Minimum Salary
Experience

1 Jobs

Role Description Als „DevOps/Platform Engineer (m/w/d)“ stellst du für unseren KI-Plattform Alan eine sichere, skalierbare, beobachtbare Plattform bereit und etablierst das Prinzip „You build it, you run it“ im Team. Du unterstützt die produktiven Teams auf „paved paths“ (Self-Service, Guardrails) und sorgst für vorhersehbare Performance und Kosten. - Ownership für zentrale Plattform-/Serving-Komponenten übernehmen - K8s-Cluster, Networking (Ingress), Storage (Datenbanken, Snapshots) und OS/Kernel-Patching betreiben und deren sicheren und stabilen Betrieb sicherstellen - Multi-Cloud-Ressourcen (insb. Open Telekom Cloud) per Konsole und IaC (Terraform) modellieren - CI/CD-Pipelines und Release-/Versionierungs-/Rollback-Strategien aufbauen - OpenTelemetry-basiertes Tracing, Metrics und Logs im Bereich Observability & Site Reliability Engineering implementieren, SLIs/SLOs, Alerting und Error Budgets definieren - Plattform für Model Serving gemeinsam mit unseren AI Engineers bereitstellen: GPU-Scheduling, Autoscaling, Inference-Gateways, Observability (Latency/QPS/Token-Kosten) Qualifications - Masterstudium oder Promotion in einem der MINT-Fächer oder einem geisteswissenschaftlichen Fach mit MINT-Vertiefung erfolgreich abgeschlossen - Mindestens 2 Jahre relevante Berufserfahrung in den Bereichen DevOps, Site Reliability Engineering oder Platform Engineering - Nachweisliche Verantwortung für Kubernetes, IaC, CI/CD, Observability sowie den produktiven Betrieb – idealerweise im SaaS-Umfeld - Praxis-Know-how in Git-basierten Deployments, modularer IaC, Secret-/Config-Management sowie Incident-Erfahrung - Security-Fachwissen in Netzwerksicherheit, Secrets, Härtung (CIS), Software-Supply-Chain und Zugriffsprinzipien (Least Privilege) - Idealerweise erste Praxiserfahrung im Betrieb von Inferenz-Workloads (vLLM o. ä.), GPU-Capacity-Management, Autoscaling und Observability - Neugier und Wissbegierde sowie ausgeprägte Problemlösungs- und Kommunikationsfähigkeit - Überzeugende und effiziente Kommunikation in deutscher und englischer Sprache Benefits - Arbeiten an einer hochmodernen, skalierbaren AI-Plattform mit viel Gestaltungsspielraum - Früh Verantwortung für zentrale Infrastruktur- und Architekturentscheidungen übernehmen - Fachlicher Austausch auf Augenhöhe mit zukünftigen Kolleg:innen - Budget und Zeit für eigene Innovationsprojekte - Fachliche und persönliche Weiterentwicklung durch speziell abgestimmte Weiterbildungen, Zertifizierungen und Laufbahnprogramme - Schwerpunktsetzung und Ausbau in Spezialgebieten - Attraktives Fixgehalt zzgl. Umsatz- und Ergebnisbeteiligung - Überstunden ausgleichen und Reisezeiten als Arbeitszeit buchen - Freie Wahl des Arbeitsorts und flexible Arbeitszeit - Top ausgestatteter Arbeitsplatz, JobRad, Body & Mind Workout, GamesNights, Grillen auf der Dachterrasse - Team-Aktionen mit unternehmungslustigen Kolleg:innen, Sommerfeste mit Familienmitgliedern und viele weitere Benefits

Worldwide