Senior Machine Learning Engineer

Location

Europe

Posted

33 days ago

Salary

€6.5K - €9K / year

Seniority

Senior

No structured requirement data.

Job Description

Senior Machine Learning Engineer

CAST AI

Role Description In the AI Enabler team, our day is usually full of R&D challenges. Have you ever encountered a situation where you need to expand your AI infrastructure so that the applications can automatically pick the right large language models (LLMs) that are both more cost-efficient and better performing? Most of us probably do nowadays, or at least understand the complexity of making such decisions while keeping track of our cloud budget. One of the team's responsibilities is ensuring that whenever a customer makes AI-related decisions regarding their K8s infrastructure, they are implemented automatically without unnecessary costs or hassle. This is just one small piece of a bigger puzzle. To get into a more detailed perspective, ask yourself the following questions: - How often do you use LLMs? - What is the least expensive LLM you can pick for a given prompt without degrading the quality of the response? - How much do your applications cost per 1 million tokens and how can you improve it? - Which API keys have the biggest waste? - How can you improve your frequently running prompt to use fewer tokens? - What is fine-tuning and how to do it efficiently? - What is a transformer? Being a part of this team would involve design and decision-making end-to-end while collaborating with colleagues from other teams. Cast AI, being a technical product, encourages not only coding something as written in the JIRA ticket but also coming up with new features and potential solutions to customers' problems. Given that the team is working on a technical greenfield project, you will have the opportunity to impact it in many ways positively. Here are some of the tools we use daily: - Python - vLLM, SGLang, TensorRT, PyTorch - ClickHouse - PostgreSQL for persistence - GCP Pub/Sub for messaging - gRPC for internal communication - REST for public APIs - Kubernetes, which our product is evolving around - AWS, GCP, and Azure cloud providers, which are currently supported in our platform - GitLab CI with ArgoCD as our GitOps CD engine - Prometheus, Grafana, Loki, and Tempo for observability Qualifications - 5+ years of hands-on experience in Data Science and Machine Learning, with a proven track record, demonstrated through a robust portfolio of projects. - Strong software engineering skills in Python. - Ability to move fast in an environment where things are sometimes loosely defined and may have competing priorities or deadlines. - Expertise in ML inference optimizations, including techniques such as: - Reducing initialization time and memory requirements; - Utilizing reduced precision and weight quantization; - Inference engine tuning (vLLM, SGLang, TensorRT). - Knowledge of network optimization for distributed ML training and inference. - Understanding of distributed training patterns and checkpointing strategies. - You have to be physically in any of the European countries GMT 0 to GMT +3. - Strong English skills. - Strong verbal and written communication skills. - Ability to work independently and collaborate in a group. Requirements - Evaluate and Analyze LLM performance. - Architect and build inference and training pipelines, directly contributing through hands-on design, model training pipeline, and deployment strategies. - Stay up to date with industry trends. Benefits - Competitive salary (€6,500 - €9,000 gross, depending on the level of experience) - Enjoy a flexible, remote-first global environment. - Collaborate with a global team of cloud experts and innovators, passionate about pushing the boundaries of Kubernetes technology. - Equity options. - Get quick feedback with a fast-paced workflow. Most feature projects are completed in 1 to 4 weeks. - Spend 10% of your work time on personal projects or self-improvement. - Learning budget for professional and personal development - including access to international conferences and courses that elevate your skills. - Annual hackathon to spark new ideas and strengthen team bonds. - Team-building budget and company events to connect with your colleagues. - Equipment budget to ensure you have everything you need. - Extra days off to help maintain a healthy work-life balance. Hiring process - Screening call with Recruiter - Hiring Manager interview - Technical interview (system design) - Live coding - Culture Check interview with an executive *As part of our standard hiring process, we would like to inform you that a background check may be conducted at the final stage of recruitment through our third-party provider, Checkr. *Please note that Cast AI does not provide any form of visa sponsorship/work permit.

Related Job Pages

More Machine Learning Engineer Jobs

Full TimeRemoteTeam 51-200

Gestalte mit uns die datengetriebene Zukunft. Du möchtest Unternehmen helfen, bessere Entscheidungen durch intelligente Datenlösungen zu treffen? Als (Senior) Consultant bei Blueforte entwickelst du moderne Analytics-Architekturen und begleitest unsere Kund:innen auf dem Weg zur datengetriebenen Organisation – strategisch, technisch und partnerschaftlich. Deine Perspektiven. Unsere Benefits. New Work-Kultur. Weil Arbeit mehr sein kann: 9 Gründe für Blueforte. - #INNOVATIVE - Vielfalt statt Routine. Du arbeitest an spannenden Projekten, mit wechselnden Herausforderungen und Kund:innen in einer Zukunftsbranche. - #WORKLIFEFLOW - Flexibel, wie es zu dir passt. Arbeite remote in ganz Deutschland oder nutze unsere Coworking-Spaces – abgestimmt auf dein Projekt und dein Leben. - #POWERBREAK - Erholung, die zu dir passt. 30 Urlaubstage, 3 zusätzliche Me-Time-Tage und Workation im EU-Ausland. Oder mal länger raus? Ein Sabbatical macht‘s möglich. - #CAREERBOOST - Dein Weg. Deine Entwicklung. Ob Fachlaufbahn, Projektleitung, Kund:innenmanagement oder Führungsrolle – wir fördern dich mit Trainings, Zertifizierungen und individueller Weiterbildung. Natürlich übernehmen wir die Kosten. - #MINDFLEX - Ideen haben Raum. Deine Ideen zählen: Für Business-Development-Initiativen und Sales-Support-Aktivitäten steht dir ein unternehmensweites Budget zur Verfügung, auf das du dich mit überzeugenden Ideen bewerben kannst. Zusätzlich kannst du unser CloudLab als Innovationsspielwiese nutzen. - #CULTURECONNECT - Hier zählt Teamgeist. Flache Hierarchien, starke Kolleg:innen, eindrucksvolle Events. Bei Blueforte erlebst du Zusammenhalt, der inspiriert und trägt. - #FITGESUND - Weil deine Gesundheit zählt. Mitgliedschaft bei Urban Sports Club oder EGYM Wellpass, Jobrad, betriebliche Krankenzusatzversicherung – und ein durchdachtes Corporate Health Management. - #FAMILYTIME - Wir denken Familie mit. 10 Tage Kind krank pro Jahr – ohne Bürokratie, mit vollem Gehalt. Sowie Kitazuschuss für deine Betreuungskosten. - #RESPONSIBLE - Nachhaltig unterwegs. E-Mobility, Bahnfahrten 1. Klasse und ÖPNV-Zuschuss – für deine smarte Mobilität. Was du bei uns machen wirst. - Als KI-Expert:in entwickelst und optimierst du Machine Learning- und Deep Learning-Modelle für verschiedene Anwendungsfälle und setzt sie produktiv ein. - Du analysierst komplexe Datenstrukturen, leitest passende statistische und mathematische Verfahren ab und bringst dein Wissen in innovative KI-Lösungen ein. - Du arbeitest mit gängigen ML-Frameworks wie scikit-learn, PyTorch oder TensorFlow und nutzt Tools wie Jupyter Notebooks, Huggingface oder Llama Index für deine Projekte. - Du entwickelst gut strukturierten, wartbaren Code (bevorzugt in Python) und orientierst dich dabei an Best Practices. - Du bringst dich aktiv in den gesamten Entwicklungszyklus ein – von der Konzeption über die Modellvalidierung bis hin zur Implementierung und Wartung der KI-Lösungen. Wir suchen dich. - Du hast ein abgeschlossenes Studium in einem naturwissenschaftlichen Fach und fundiertes Wissen in Statistik und Mathematik. - Du verfügst über tiefgehende Erfahrung mit Machine Learning- und Deep Learning-Techniken und hast diese bereits produktiv eingesetzt. - Du bist sicher in der Programmierung, idealerweise mit Python, und kennst dich mit Code-Versionierung (z. B. Git) aus. - Erste Berührungspunkte mit Data Engineering und Requirements Engineering runden dein Profil ab. - Du bist kommunikativ, lösungsorientiert und ein:e echte:r Hands-on-Teamplayer:in, der:die Zusammenarbeit auf Augenhöhe schätzt und Teamspirit lebt. - Du sprichst fließend deutsch und verfügst über gute Englischkenntnisse. - Du arbeitest überwiegend remote und solltest daher bereit sein, regelmäßig zu Kund:innen in ganz Deutschland zu reisen.

Germany
Global InfoTek, Inc. logo

Senior AI/ML Engineer

Global InfoTek, Inc.

Where rising standards meet global demands.

Full TimeRemoteTeam 51-200Since 2001H1B No Sponsor

• Design, build, and validate machine learning models for RF emitter identification — including feature engineering from sensor data, training pipeline development, model evaluation, and iterative refinement based on results • Conduct hands-on exploratory data analysis on RF sensor datasets using Python and Jupyter notebooks — writing and running analytical code, characterizing feature distributions, identifying data quality issues, and producing documented findings • Implement and maintain ML data pipelines — ingesting NDF sensor streams, applying rollup and preprocessing logic, constructing training datasets, and ensuring pipeline correctness on constrained edge hardware with no cloud dependency • Collaborate with the technical lead and Principal AI/ML Engineer to investigate RF sensor data quality, attribution reliability, and feature behavior under contention — writing code to characterize error sources, validate assumptions, and reproduce findings • Produce clear technical documentation of experiments, model configurations, and results — maintaining reproducibility through disciplined versioning, and contributing to monthly status reports and team knowledge sharing

Virginia
$100K - $300K / year
Volkswagen AG logo

Intern / Thesis - Learning-based Radar-Camera Fusion for Simultaneous Localization & Mapping (m/f/d) Intern / Thesis - Learning-based Radar-Camera Fusion for Simultaneous Localization & Mapping (m/f/d) Intern / Thesis - Learning-based Radar-Camera Fusion for Simultaneous Localization & Mapping (m/f/d)

Volkswagen AG

Volkswagen Group of America is an Equal Opportunity Employer. We welcome and encourage applicants from all backgrounds, and do not discriminate based on race, sex, age, disability, sexual orientation, national origin, religion, color, gender identity/expression, marital status, veteran status, or any other characteristics protected by applicable laws. This role description is a guideline and does not create contractual rights between the Company and any of its applicants. The Company does not enter into any type of employment contract, implied or written, with its applicants regarding job security. This Organization participates in E-Verify. We maintain a drug free workplace and perform pre-employment substance abuse testing.

InternshipRemoteTeam 10,001

Wir sind CARIAD, das Automotive-Software-Unternehmen der Volkswagen Group. Unsere Teams entwickeln Softwareplattformen und digitale Kundenfunktionen für legendäre Marken wie Audi, Volkswagen und Porsche – und unterstützen so die Volkswagen Group auf ihrem Weg zum führenden automobilen Technologiekonzern. CARIDIANS in Softwarezentren in Deutschland, den USA, China, Estland und Indien arbeiten daran, die Automobilität für alle neu zu gestalten. DEIN TEAM Als Praktikant unterstützen Sie Teams, indem Sie theoretisches Wissen praktisch anwenden, wertvolle Praxiserfahrung sammeln und zu wichtigen Geschäftsaktivitäten beitragen. Der Schwerpunkt liegt auf Ihrer beruflichen Entwicklung durch betreute Aufgaben, die Wachstum und Zusammenarbeit fördern. Sie wirken aktiv an täglichen Abläufen und Projekten mit, erweitern Ihr Branchenwissen, Ihre technischen Fähigkeiten und arbeiten eng mit erfahrenen Fachleuten zusammen. DEINE AUFGABEN - Recherche zum aktuellen Stand der Technik sowie zu relevanten Algorithmen und Datensätzen - Implementierung und Benchmarking von Deep-Learning- oder geometrischen SLAM-Methoden für Baseline-Vergleiche - Entwicklung und Evaluation von Fusionspipelines für Radar- und Kameradaten - Testen und Validieren der Ergebnisse mit realen automobilen Daten Anforderungen an die Qualifikation - Sehr gute Studienleistungen - Eingeschriebener Studentin der Informatik, Robotik, Elektrotechnik, Mathematik oder eines vergleichbaren Studiengangs - Kenntnisse relevanter Sensoren für autonomes Fahren sowie Messtechnik - Programmierkenntnisse und Erfahrung in Python oder C++ - Sehr gute Englischkenntnisse in Wort und Schrift - Hohes Maß an Engagement, Eigeninitiative und Teamfähigkeit NICE TO KNOW - Möglichkeit für Remote-Arbeit innerhalb Deutschlands - Dauer: 3 – 6 Monate - 35 Stunden/Woche - Vergütung: 13,90 €/Stunde Bei CARIAD schätzen wir Individualität und Vielfalt – denn wir sind überzeugt, dass uns unsere Unterschiede stärker machen. Wir setzen uns aktiv dafür ein, Teams mit unterschiedlichen Hintergründen, Perspektiven und Erfahrungen aufzubauen. Unser Ziel ist ein Arbeitsumfeld, in dem sich alle wertgeschätzt fühlen und ihre Stärken einbringen können. Wenn du aufgrund einer Behinderung Unterstützung bei deiner Bewerbung brauchst, melde dich gerne bei uns unter careers@cariad.technology – wir helfen dir gerne weiter.

Germany
€14 / hour
Guidehouse logo

MLOps Engineer

Guidehouse

Guidehouse, a "next-generation consultancy" and a portfolio company of Veritas Capital, provides management, risk consulting, and technology services to help cl

• As an MLOps Engineer, you will design, implement, and support the platforms, pipelines, and operational processes that enable scalable, secure, and reliable deployment of machine learning solutions for federal clients. • You will partner closely with data scientists, AI engineers, data engineers, and government stakeholders to operationalize models across development, testing, and production environments. • You will play a critical role in enabling secure AI and ML delivery within DoD and federal financial environments, ensuring models are repeatable, auditable, and compliant with federal standards. • Design, build, and maintain end‑to‑end MLOps pipelines, supporting model training, testing, deployment, monitoring, and retraining • Implement CI/CD workflows for ML models and data pipelines in secure federal environments • Operationalize machine learning models built by data science teams and ensure production readiness • Develop and manage model versioning, artifact management, and experiment tracking • Implement monitoring solutions for model performance, drift, data quality, and pipeline health • Automate infrastructure provisioning and deployment using infrastructure‑as‑code and DevOps best practices • Support auditability, explainability, and governance of AI/ML systems • Collaborate with stakeholders to align MLOps architectures with mission needs and security requirements

Virginia
$113K - $188K / year