Principal Software Engineer – Distributed Systems

Full-stack EngineerSoftware EngineerFull TimeRemoteLeadTeam 1,001-5,000H1B SponsorCompany SiteLinkedIn

Location

United States

Posted

2 days ago

Salary

$215K - $300K / year

Seniority

Lead

Job Description

Principal Software Engineer – Distributed Systems

Alteryx

• Define, evolve, and own the architectural vision and roadmaps for the major platform domains (e.g. orchestration, job execution, data pipelines, sidecar services) • Perform architecture reviews, assess proposals from teams, and vet designs for adherence to standards, scalability, performance, reliability, and security • Lead or contribute hands-on to critical subsystems (e.g. orchestrator, scheduling, service mesh, job pipelines, stateful services) • Drive and enforce cross-team architectural patterns • Provide thought leadership: prototype proofs-of-concept, evaluate new tools/technologies, bring innovation into the platform • Mentor and coach architects, senior engineers, and guide teams through architectural change • Collaborate with infrastructure, operations, SRE, security, and DevOps to ensure the architecture is operable, observable, and maintainable in production • Help define and lead architecture governance (e.g. architecture review board, reference architectures, standards, guidelines) • Participate in tech strategy, roadmap planning with product & engineering leadership • Diagnose and resolve technical debt or architectural "smells" across the codebase, enforcing consistency

Job Requirements

  • ~10+ (or more) years of software engineering experience
  • At least 3–5 years in senior architect or principal-level roles (or equivalent)
  • Proven track record of designing and operating large-scale, distributed systems in a production environment
  • Deep hands-on experience with orchestration, scheduler systems, job pipelines, or workflow engines
  • Strong proficiency in one or more of: Java / JVM ecosystem, Python, Node.js, or equivalent high-level backend languages
  • Experience with message/event systems (e.g. Kafka or similar), queueing, streaming architectures
  • Familiarity with in-memory data stores and caching (e.g. Redis or equivalents)
  • Strong knowledge of containerization, Kubernetes, sidecar patterns, service meshes, proxies, etc.
  • Understanding or experience in split-plane architectures (control plane / data plane separation) is highly desirable
  • Strong skills in API design, data modeling, integration patterns, error handling, consistency
  • Experience with observability (metrics, tracing, logging) and designing systems for operability and failure modes
  • Ability to conduct performance analysis, capacity planning, scaling, fault tolerance strategies
  • Excellent communication skills—able to articulate tradeoffs, convince stakeholders, write design docs, lead design reviews
  • Ability to function autonomously, make decisions in ambiguity, drive consensus across teams, and adopt/evict technologies as needed
  • Strong judgment about when to optimize vs. when to simplify
  • Familiarity with high-scale cloud deployments (e.g. AWS, Azure, GCP) and infrastructure-as-code is a plus

Benefits

  • Medical, dental, and vision coverage
  • 401(k) with company match
  • Paid parental leave, caregiver leave, and flexible time off
  • Mental health support and wellness reimbursement
  • Career development and education assistance
  • Connectivity Plus stipend of $150 to support remote work-related expenses
  • An annual $200 home office reimbursement

Related Job Pages

More Full-stack Engineer Jobs

Role Description Buscamos uma pessoa Senior Software Engineer Fullstack – Payments para atuar em iniciativas críticas relacionadas ao ecossistema financeiro da Insider, com foco em fluxos de pagamento, tesouraria, conciliação, integrações fiscais e sustentação da operação core de pagamentos da empresa. Essa pessoa terá papel fundamental na evolução da arquitetura, confiabilidade e segurança dos sistemas financeiros e de pagamentos, garantindo alta disponibilidade, rastreabilidade, resiliência e consistência em fluxos transacionais de missão crítica. Esperamos alguém com forte experiência em backend, boa atuação fullstack e vivência com integrações complexas, capaz de navegar por contextos de alta criticidade operacional, tomar decisões técnicas de alto impacto e atuar como referência técnica para o time. Nossa stack principal hoje é NestJS, TypeScript e GCP. Valorizamos experiência prática com esse ecossistema, mas também buscamos alguém com repertório para propor padrões, ferramentas e arquiteturas mais eficientes quando fizer sentido para o produto e para a operação. Embora seja uma posição fullstack, o foco principal será em backend, integrações com gateways, adquirentes, antifraude, serviços financeiros e arquitetura distribuída orientada a eventos, webhooks e transações. Responsibilities - Projetar, desenvolver e evoluir sistemas críticos relacionados ao fluxo de pagamentos da Insider, principalmente com NestJS, TypeScript e serviços em GCP. - Atuar em iniciativas envolvendo gateways de pagamento, adquirentes, antifraude, conciliação, tesouraria, chargebacks, estornos, webhooks e integrações fiscais. - Garantir confiabilidade, rastreabilidade, segurança e resiliência dos fluxos financeiros da empresa, reduzindo risco operacional em processos transacionais. - Desenvolver soluções escaláveis para processamento transacional, com foco em disponibilidade, consistência, observabilidade e recuperação segura de falhas. - Participar ativamente de decisões arquiteturais relacionadas ao ecossistema financeiro e de pagamentos, propondo padrões técnicos quando houver ganho claro para o negócio. - Trabalhar na evolução de integrações entre serviços internos, ERPs, plataformas fiscais, gateways, adquirentes e parceiros financeiros. - Definir e implementar estratégias de idempotência, retries, deduplicação, tolerância a falhas, compensação e recuperação de transações. - Evoluir APIs, workers, filas, eventos e rotinas de backoffice que suportam a operação de pagamentos e financeiro. - Desenvolver e revisar código com foco em qualidade, segurança, performance, testabilidade e manutenção de longo prazo. - Atuar como referência técnica para pessoas menos experientes do time, apoiando através de code reviews, pair programming e compartilhamento de conhecimento. - Contribuir na definição e evolução de boas práticas de engenharia, observabilidade, testes automatizados, CI/CD e operação de sistemas críticos. - Trabalhar em parceria com times multidisciplinares para transformar desafios operacionais, financeiros e de produto em soluções técnicas robustas. Qualifications - Experiência sólida em desenvolvimento backend utilizando Node.js e TypeScript. - Experiência prática com NestJS ou frameworks backend similares, com capacidade de aplicar boas práticas de arquitetura, modularização e testes. - Vivência em posições sênior, atuando com autonomia em sistemas distribuídos, integrações complexas e aplicações de alta criticidade. - Experiência prática com integrações de pagamento, gateways, adquirentes, antifraude ou serviços financeiros. - Conhecimento consistente sobre APIs REST, webhooks, mensageria e comunicação entre serviços. - Experiência com modelagem de dados e bancos relacionais, especialmente PostgreSQL. - Conhecimento sobre processamento assíncrono, filas, eventos e estratégias de resiliência transacional. - Vivência com conceitos como idempotência, consistência eventual, retries, deduplicação e observabilidade em sistemas críticos. - Experiência com Docker e ambientes em cloud, preferencialmente GCP. - Familiaridade com CI/CD, testes automatizados e práticas modernas de engenharia de software. - Experiência com monitoramento, logs estruturados, métricas, tracing e investigação de incidentes em produção. - Conhecimento de boas práticas de segurança para APIs e dados sensíveis em fluxos de pagamento. - Capacidade de atuar em demandas fullstack quando necessário, colaborando em interfaces internas, ferramentas operacionais ou aplicações modernas. - Boa capacidade analítica e autonomia para atuar em problemas complexos e de alto impacto. - Perfil colaborativo, com boa comunicação e interesse em desenvolvimento técnico de outras pessoas. Benefits - Modelo de contrato: PJ; - Modelo de trabalho: Remoto; - Descanso sem ser descontado; 22 dias úteis anuais, disponível após os três primeiros meses; - Cartão Flexível; - Plano de Saúde; - Plano Odonto; - Totalpass; - Udemy; - Insider Perks; - Oportunidade de crescimento e aprendizado em uma startup em rápida expansão; - Ambiente de trabalho colaborativo e inovador, com exposição a novas tecnologias e processos.

Brazil
Full TimeRemoteTeam 501-1,000H1B Sponsor

• Own the infrastructure that connects data, campaigns, and revenue • Collaborate with VP of Growth Marketing for GTM analytics • Own technical integration layer for marketing tools • Develop AI workflows for campaign intelligence • Architect event tracking and attribution systems • Maintain a living GTM technology roadmap

Texas
Gappify logo

Software Development Engineer – Contractor

Gappify

Hi, we're Gappify. We're a SaaS provider of accrual automation solutions for mid-market and enterprise accounting teams.

ContractRemoteTeam 51-200Since 2016H1B No Sponsor

• Execute database updates, data fixes, scripts, and configuration changes across QA, UAT, Staging, and Production environments • Investigate application behavior, system issues, and data discrepancies raised by internal teams • Support production troubleshooting, log analysis, and deployment activities • Perform root cause analysis and coordinate fixes for recurring issues • Maintain documentation for scripts, processes, and operational changes • Support release activities, monitoring, and post-deployment validation • Handle urgent operational and business-critical requests as needed

Philippines
Red Hat logo

Software Engineer – GCP Hosted Control Planes

Red Hat

Founded in 1993, Red Hat is an award-winning technology firm working to serve as the go-to company for communities of contributors, customers, and partners in c

• Lead the design of the GCP HCP platform architecture, including multi-region scalability, multi-tenancy and isolation, automated lifecycle management, and operational resilience • Design and evolve the team's harness engineering infrastructure: the system of architectural constraints, custom linters, structural tests, CI gates, and feedback loops that enable AI agents to produce reliable work at scale • Define and maintain the team's documentation architecture — a structured knowledge base that serves as the source of truth for both agents and engineers, treating AGENTS.md as the table of contents with deep references into design documents, architecture decision records, and operational runbooks • Decompose complex system goals into well-bounded building blocks suitable for agent-driven implementation; evaluate when agent-generated approaches are sound and when they introduce unacceptable risk • Identify and address architectural drift, entropy, and emergent quality issues across a large, agent-maintained codebase — designing systematic "garbage collection" processes to fight decay • Lead architectural discussions across the HyperShift project, Cluster API communities, GCP platform integrations, and internal Red Hat teams • Establish and enforce patterns for secure, maintainable, and observable systems — defining the module boundaries, dependency hierarchies, and interface contracts that constrain the solution space for both humans and agents • Mentor senior engineers in harness engineering practices: crafting effective specifications, designing structural constraints, building agent-friendly documentation, and developing critical review skills for agent output • Define quality bars, test strategies, and operational readiness criteria for agent-produced features, collaborating with Product Management and technical support to ensure production standards are met • Serve as an escalation point for complex customer issues and production incidents beyond front-line technical support, applying deep platform knowledge to diagnosis and resolution • Participate in on-call rotations to support production managed services • Maintain a visible technical leadership presence in the Kubernetes, OpenShift, and GCP communities

Ireland