Accelerate drug time to market through real study traceability and unparalleled trial integrity
Data Engineer
Location
United Kingdom
Posted
41 days ago
Salary
0
Seniority
Mid Level
Job Description
Data Engineer
Verisian
About Us At Verisian, we build deep tech and AI solutions that enable groundbreaking medical therapies to enter the market faster and safely. New medicines and devices are judged using all available evidence in the proper context and backed by automated analyses that validate and make data and results transparent to companies and regulators alike. Regulators will make the right decisions on novel therapies faster and with greater confidence, protecting patients from harm and making breakthrough treatments available as soon as is possible and safe. In times of increasing trial numbers and complexity, we are building technical innovation to remove crucial bottlenecks for pharmaceutical and medical device companies, as well as public health authorities, directly affecting clinical trial planning, analyses, validation, submission, and market approval. By joining us, you will commit yourself to building software and AI tools that directly contribute to increasing the rate at which medical innovation improves human health and wellbeing. Disclaimer: We welcome candidates of diverse experience levels, and meeting every requirement is not mandatory. Research indicates that underrepresented groups tend to apply only if they meet all qualifications. If you're enthusiastic about the role, please apply and let our recruiters evaluate your application. Culture At Verisian, our mission is to build the future infrastructure of medical innovation. To help us succeed, we're creating a unique employee culture. We always put the mission first. We're fanatically customer obsessed, crafting world-class products that customers love with every interaction. We take extreme ownership and accountability of our work, seeing whatever we do through to completion. We communicate candidly and directly with each other, even when it's uncomfortable. We're innately curious, open to alternative perspectives and invest passionately in our own continuous growth. Role Description As a Data Engineer, you will join our world-class engineering team in building the Verisian Platform. You will work on an application that exposes our clinical trial insights to data managers, statistical programmers, statisticians, medical experts/writers, and regulatory authorities. The Verisian Platform brings value to a set of highly regulated processes crucial for medical progress and innovation. Your work will support the Planner, Builder, Explorer, Validator, Submitter, and related supporting modules. These core modules of the platform target the planning, exploration/onboarding, building, validation, submission, and review of clinical trials and their results. They enable data managers, statistical programmers, statisticians, medical writers, and regulators to deliver their work faster, at higher quality, lower cost, and in greater confidence. Our pipelines analyze clinical trial documentation, code, logs, data, and results to build a knowledge graph through code traceability. We harness the resulting dataset, column-level and logic lineage to turn clinical trials into Information Infrastructure that can be used by experts and consumed by AI to revolutionize how therapies are evaluated and enter the market. We capture complex processes in fully- and semi-automated workflows that place experts in control and AI automation at their fingertips. We build visualizations to provide our customers with a maximum of insight as fast as possible. Our application stack is based on Next.js and deployed via Docker/Kubernetes in the cloud. The data analysis pipelines run in Argo Workflows. We analyze code based on Antlr4 and Java. AI agents are developed in Python. The data analysis engine is developed in Python. Git is where our code lives, and Github Actions is how it gets out into the world. In tandem, you will create data validation rules (custom DSL) and develop our data analysis engine (Python) that is used to automatically detect inconsistencies and analysis errors in data while enforcing regulatory data standard adherence. These crucial pipelines are an integral part of our platform to expose our game-changing functionality to users and consumed by our AI agents to automate the planning, analysis, validation, and submission of clinical trials. You will be expected to lead the analysis, design, building and testing of components of the engine and data validation rules. As part of our core team, you will join us in designing, prioritising, building and testing new functionality, troubleshooting customer issues, finding root causes, and deploying required fixes to ensure maximal user impact and performance.
Job Requirements
- Extensive experience in Python and ideally at least one other programming language
- Extensive experience with SQL and data engineering principles
- Extensive experience with and love for data
- Experience with and love for complex root cause analyses to find and resolve bugs
- Experience identifying and resolving performance and scalability issues
- Strong focus on building as a team: we have a We & Mission mindset
- Strong ability to communicate complex technical problems and solutions, foresee risks, and align work across multiple teams and colleagues
- “If it’s not code and documented, it doesn’t exist”-mindset
- Iteration mindset
- Bonus points for:
- Experience with data standards, specifically but not limited to CDISC SDTM/ADaM
Benefits
- What you build impacts billions of people around the world
- Highly collaborative, ambitious and world-class team
- Employee Stock Options Plan
- All remote, asynchronous work environment with in-person summits around the world
- Pension plan and additional benefits depending on country of residence
Related Guides
Related Categories
Related Job Pages
More Data Engineer Jobs
Role Description Are you passionate about leading a team of skilled engineers in a fast-paced, innovative FinTech environment? Green Street is seeking an experienced Lead Data Engineer to manage and mentor a team dedicated to designing and building robust data pipelines and architecture for the Commercial Real Estate (CRE) industry. You’ll oversee the development of advanced data solutions, integrating both public and proprietary data from diverse sources to create comprehensive data products and insights for our clients and internal research teams. Why join Green Street? We’re a highly collaborative, Agile-driven team committed to engineering excellence, leveraging the latest technologies, and continuously optimizing our data infrastructure. As a leader on our team, you’ll have the opportunity to guide data engineers and QA engineers, shape Green Street's data solutions, and work closely with cross-functional teams to deliver meaningful impact within the CRE space. We love great engineers, and we are excited to get to know you better. Please share your resume today! Responsibilities - Lead and manage a team of data engineers and data QA engineers, fostering a collaborative and high-performance culture - Design and develop robust data ingestion, ETL processes, and ensure data integrity and high availability - Document and manage data models, schema designs, and ER diagrams, ensuring a well-architected and scalable data structure - Oversee the development and maintenance of data architecture, optimizing for performance and reliability - Collaborate with research and product teams to enhance our analytical capabilities and streamline workflows - Conduct analysis on large, aggregated datasets (e.g., demographic, geographic, GIS/spatial) - Coordinate effectively with both onshore and offshore development teams, ensuring alignment and meeting project objectives Qualifications - 10+ years of experience in data engineering, with at least 3 years in a leadership role managing engineering teams - Advanced proficiency in Python (8+ years) and experience with relational databases (MySQL, PostgreSQL, etc.) - Prior experience with Git and Agile methodologies - Strong expertise in data architecture, ETL processes, and data pipeline management - Proven ability to design and optimize database schemas for complex data domains - Experience with cloud platforms, particularly AWS (Amazon RDS, Containers) - Willingness and desire to keep up with new cloud technologies, languages, standards, and practices - Strong problem-solving skills, excellent communication abilities, attention to detail, and a commitment to continuous learning and improvement - Ability to work independently in a fast-paced, agile environment - Ability to collaborate effectively with a remote team - Ability to overlap 3-4 hours with the U.S. West Coast to participate in team discussions and lead cross-time-zone collaboration Nice-to-Haves - Prior knowledge of finance, Real Estate, mathematics, GIS / spatial data is a plus - Experience with data quality best practices and automated data validation processes
• Lead the design and implementation of scalable, secure and resilient data systems across streaming, batch and real-time use cases. • Architect data pipelines, model and storage solutions that power analytical and product use cases; using primarily Python and SQL via orchestration tooling that run workloads in the cloud. • Leverage AI to automate both data processing and engineering processes. • Assure and drive best practices relating to data infrastructure, governance, security and observability. • Work with technologists across multiple teams to deliver coherent features and data outcomes. • Support the data team to help adopt data engineering principles. • Identify, validate and promote new tools and technologies that improve the performance and stability of data services.
Senior Data Platform Engineer (m/w/d) Senior Data Platform Engineer (m/w/d)
GFT Technologies SEProcuramos uma pessoa que: Goste de trabalhar em equipe e seja colaborativa em suas atribuições; Tenha coragem para se desafiar e ir além, abraçando novas oportunidades de crescimento; Transforme ideias em soluções criativas e busque qualidade em toda sua rotina; Tenha habilidades de resolução de problemas; Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo; Tenha interesse em lidar com situações adversas e inovadoras no âmbito tecnológico. Big enough to deliver – small enough to care. #VempraGFT #VamosVoarJuntos #ProudToBeGFT
GFT Technologies ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. Wir konzipieren fortschrittliche Lösungen für die Daten- und KI-Transformation, modernisieren Technologie-Infrastrukturen und entwickeln Kernsysteme der nächsten Generation für führende Banken, Versicherungen, Industrie- und Robotik-Unternehmen. In enger Zusammenarbeit mit unseren Kunden verschieben wir Grenzen, um ihr volles Potenzial auszuschöpfen. Mit fundierter Branchenexpertise, modernsten Technologien und einem starken Partnernetzwerk bietet GFT verantwortungsvolle, KI-zentrierte Lösungen, die technologische Exzellenz mit hoher Liefer- und Kosteneffizienz vereinen. Das macht uns zu einem verlässlichen Partner für nachhaltigen Geschäftserfolg. Mit über 12.000 Technologie-Expertinnen und -Experten sind wir in mehr als 20 Ländern weltweit tätig und bieten Karrieremöglichkeiten im Bereich führender Software-Innovationen. Die GFT Technologies SE (GFT-XE) ist im SDAX der Deutschen Börse notiert. Let’s Go Beyond! Im Center of Excellence Data gestalten wir das Datenfundament für die KI-Transformation unserer Kunden. Als Senior Data Platform Engineer übernimmst du eine fachlich führende Rolle in Transformationsprojekten – mit Schwerpunkt auf regulierten Branchen, insbesondere Financial Services. Du verbindest strategisches Governance-Design mit operativer Umsetzung und sorgst dafür, dass Datenplattformen nicht nur leistungsfähig, sondern auch regulatorisch compliant, auditierbar und AI-ready sind. Wir setzen alles daran, uns gemeinsam mit dir weiterzuentwickeln, um noch besser zu werden! Unser motiviertes Team freut sich auf dich und deine Erfahrung als Senior Data Platform Engineer (m/w/d)! Deine Aufgaben - Du designst und implementierst skalierbare Datenplattformen in Cloud-Umgebungen (Azure, AWS oder GCP). - Du entwickelst moderne ELT/ETL- und Streaming-Pipelines für Batch- und Near-Real-Time-Verarbeitung. - Du setzt Lakehouse-Architekturen unter Nutzung offener Storage- und Table-Formate um. - Du modellierst Datenstrukturen nach Data Vault 2.0 oder Kimball – abhängig vom fachlichen und architektonischen Kontext. - Du baust konsumfertige Datenprodukte für Analytics-, Reporting- und KI-Anwendungsfälle auf. - Du bereitest Daten für Machine-Learning-Use-Cases vor (inkl. Feature-Engineering-Logiken), ohne selbst ML-Modelle zu trainieren. - Du stellst Datenqualität, Performance und Kostenoptimierung in der Cloud sicher. - Du implementierst Orchestrierung, Automatisierung und CI/CD-Prozesse für stabile, produktionsreife Plattformen. - Du arbeitest eng mit Data Architects, Governance-Teams und Data Scientists zusammen. - Du übernimmst technische Verantwortung innerhalb konkreter Umsetzungsprojekte. Das bringst du mit - Mindestens 3–5 Jahre Erfahrung im Aufbau moderner Datenplattformen - Fundierte Kenntnisse in mindestens einer Cloud-Plattform (Azure, AWS oder GCP) - Sehr gute SQL-Kenntnisse sowie Erfahrung mit Python (oder vergleichbar) - Erfahrung mit Streaming-Technologien (z. B. Kafka, Pub/Sub, Kinesis oder vergleichbar) - Praxis in der Datenmodellierung nach Data Vault 2.0 und/oder Kimball - Verständnis moderner Lakehouse-Architekturen und offener Speicherformate - Erfahrung mit Orchestrierung und Automatisierung von Datenpipelines - Know-how in Performance- und Kostenoptimierung in Cloud-Umgebungen - Erfahrung in der Zusammenarbeit mit Analytics- und Data-Science-Teams - Sehr gute Deutsch- und Englischkenntnisse. Das bieten wir dir - Flexible Arbeitszeiten: Um Familie und Beruf optimal zu vereinbaren, kannst du deinen Arbeitstag nach deinen individuellen Bedürfnissen gestalten. Profitiere darüber hinaus von individuellen Modellen, Workation und Sabbaticals. - Homeoffice: Egal, ob aus dem Büro oder von einem anderen Ort – mobiles Arbeiten gehört für uns zum Alltag. - Mindset: Open Door, Teamspirit und flache Hierarchien sind im #teamGFT keine Buzzwords, sondern gelebte Praxis. - 12.000 Talente weltweit: Profitiere von dem globalen Austausch mit Experten aus über 20 Ländern auf deinem Gebiet. - Weiterbildung & Zertifizierungen: Nimm an Fortbildungen, Konferenzen und Zertifizierungen teil. Wir gehen auf deine individuellen Bedürfnisse ein. - Standortbezogene Extras: Profitiere von weiteren Zusatzleistungen, wie Job Rad, Betrieblicher Altersvorsorge und vielem mehr. - Neueste Technologien: Durch die Arbeit mit international führenden Konzernen und den Einsatz interdisziplinärer Teams arbeiten wir am Puls der Zeit und setzen uns ständig mit den neuesten Methoden und Technologien auseinander.
Data Platform Architect (w/m/d) Data Platform Architect (w/m/d)
GFT Technologies SEProcuramos uma pessoa que: Goste de trabalhar em equipe e seja colaborativa em suas atribuições; Tenha coragem para se desafiar e ir além, abraçando novas oportunidades de crescimento; Transforme ideias em soluções criativas e busque qualidade em toda sua rotina; Tenha habilidades de resolução de problemas; Possua habilidade e se sinta confortável para trabalhar de forma independente e gerenciar o próprio tempo; Tenha interesse em lidar com situações adversas e inovadoras no âmbito tecnológico. Big enough to deliver – small enough to care. #VempraGFT #VamosVoarJuntos #ProudToBeGFT
GFT Technologies ist ein verantwortungsvolles, KI-zentriertes globales Unternehmen im Bereich der digitalen Transformation. Wir konzipieren fortschrittliche Lösungen für die Daten- und KI-Transformation, modernisieren Technologie-Infrastrukturen und entwickeln Kernsysteme der nächsten Generation für führende Banken, Versicherungen, Industrie- und Robotik-Unternehmen. In enger Zusammenarbeit mit unseren Kunden verschieben wir Grenzen, um ihr volles Potenzial auszuschöpfen. Mit fundierter Branchenexpertise, modernsten Technologien und einem starken Partnernetzwerk bietet GFT verantwortungsvolle, KI-zentrierte Lösungen, die technologische Exzellenz mit hoher Liefer- und Kosteneffizienz vereinen. Das macht uns zu einem verlässlichen Partner für nachhaltigen Geschäftserfolg. Mit über 12.000 Technologie-Expertinnen und -Experten sind wir in mehr als 20 Ländern weltweit tätig und bieten Karrieremöglichkeiten im Bereich führender Software-Innovationen. Die GFT Technologies SE (GFT-XE) ist im SDAX der Deutschen Börse notiert. Let’s Go Beyond! Im Center of Excellence Data entwickeln wir moderne, skalierbare AI-Ready Data Platforms, die Analytics- und KI-Use Cases produktiv ermöglichen. Als Data Platform Architect übernimmst du die architektonische Verantwortung in Kundenprojekten. Du konzipierst Cloud- und Lakehouse-Architekturen, die leistungsfähig, sicher, governance-konform und zukunftssicher sind – mit klarem Fokus auf die Bereitstellung hochwertiger Daten für KI- und ML-Anwendungen. Du arbeitest eng mit Engineers, Governance-Experten und Fachbereichen zusammen und stellst sicher, dass Architekturlösungen langfristig tragfähig sind. Wir setzen alles daran, uns gemeinsam mit dir weiterzuentwickeln, um noch besser zu werden! Unser motiviertes Team freut sich auf dich und deine Erfahrung als Data Platform Architect (m/w/d) Deine Aufgaben - Du entwirfst End-to-End-Architekturen für moderne Datenplattformen in Cloud-Umgebungen (Azure, AWS oder GCP). - Du definierst Zielarchitekturen für Lakehouse-, Data-Warehouse- und hybride Plattformmodelle. - Du verantwortest Architekturentscheidungen hinsichtlich Skalierbarkeit, Sicherheit, Governance und Kostenoptimierung. - Du konzipierst Datenarchitekturen zur Unterstützung von KI- und ML-Use-Cases – einschließlich Feature-Bereitstellung und strukturierter Datenprodukte. - Du strukturierst Datenflüsse für Batch- und Streaming-Szenarien. - Du definierst Modellierungsstrategien (z. B. Data Vault 2.0 oder dimensionale Modellierung nach Kimball). - Du stellst die Integration von Data Governance- und Compliance-Anforderungen sicher. - Du führst Architektur-Workshops durch und übersetzt fachliche Anforderungen in belastbare technische Konzepte. - Du begleitest die Umsetzung durch Engineering-Teams und sicherst Architekturqualität. Das bringst du mit - Mehrjährige Erfahrung (typisch 5–8+ Jahre) im Bereich Datenarchitektur oder Data Platform Design - Fundierte Kenntnisse in mindestens einer Cloud-Plattform (Azure, AWS oder GCP) - Tiefes Verständnis moderner Lakehouse- und Data-Warehouse-Architekturen - Erfahrung in der Definition skalierbarer Datenmodelle (Data Vault 2.0 und/oder Kimball) - Architekturverständnis für Streaming- und Batch-Verarbeitung - Erfahrung in Security-, Access- und Governance-Konzepten für Datenplattformen - Fähigkeit, komplexe technische Sachverhalte strukturiert und verständlich zu vermitteln - Multi- Multi-Cloud Erfahrung und Beteiligung an Transformations- oder Modernisierungsprogrammen von Vorteil. - Sehr gute Deutsch- und Englischkenntnisse. Das bieten wir dir - Flexible Arbeitszeiten: Um Familie und Beruf optimal zu vereinbaren, kannst du deinen Arbeitstag nach deinen individuellen Bedürfnissen gestalten. Profitiere darüber hinaus von individuellen Modellen, Workation und Sabbaticals. - Homeoffice: Egal, ob aus dem Büro oder von einem anderen Ort – mobiles Arbeiten gehört für uns zum Alltag. - Mindset: Open Door, Teamspirit und flache Hierarchien sind im #teamGFT keine Buzzwords, sondern gelebte Praxis. - 12.000 Talente weltweit: Profitiere von dem globalen Austausch mit Experten aus über 20 Ländern auf deinem Gebiet. - Weiterbildung & Zertifizierungen: Nimm an Fortbildungen, Konferenzen und Zertifizierungen teil. Wir gehen auf deine individuellen Bedürfnisse ein. - Standortbezogene Extras: Profitiere von weiteren Zusatzleistungen, wie Job Rad, Betrieblicher Altersvorsorge und vielem mehr. - Neueste Technologien: Durch die Arbeit mit international führenden Konzernen und den Einsatz interdisziplinärer Teams arbeiten wir am Puls der Zeit und setzen uns ständig mit den neuesten Methoden und Technologien auseinander.


