GFT Technologies logo
GFT Technologies

As a pioneer for digital transformation GFT develops sustainable solutions across new technologies.

Senior DevOps, AWS

DevOps EngineerDevOps EngineerFull TimeRemoteSeniorTeam 10,001+Since 1987H1B No SponsorCompany SiteLinkedIn

Location

Brazil

Posted

2 days ago

Salary

0

Seniority

Senior

Job Description

Senior DevOps, AWS

GFT Technologies

• Liderar a instrumentação ponta a ponta de métricas, logs estruturados e tracing distribuído, garantindo visibilidade holística do ecossistema. • Implementar, evoluir e gerenciar ferramentas de Application Performance Monitoring para identificar gargalos de código e otimizar proativamente a experiência do usuário. • Definir, implementar e monitorar SLIs, SLOs e Error Budgets, atuando como embaixador da disponibilidade e auxiliando os times a equilibrar a velocidade de inovação com a estabilidade produtiva. • Planejar, arquitetar e executar experimentos práticos de Engenharia do Caos (Chaos Engineering) para validar hipóteses de falha e blindar a arquitetura contra incidentes reais. • Desenhar e gerenciar políticas de alertas preditivos e inteligentes, focando na eliminação da fadiga de alertas e garantindo respostas ultra-rápidas a incidentes críticos. • Atuar de forma transversal apoiando tanto a sustentação de pipelines complexos de Engenharia de Dados quanto as arquiteturas de microsserviços de Backend (APIs REST) hospedadas na AWS.

Job Requirements

  • Especialista em Datadog: Domínio avançado da plataforma para criação de dashboards executivos/técnicos, monitores complexos, APM e Log Management.
  • Infraestrutura Cloud e Orquestração: Experiência sólida e comprovada com o ecossistema AWS, além de proficiência em containerização com Docker e orquestração em larga escala com Kubernetes (EKS).
  • Cultura de Automação: Vivência prática no desenvolvimento de automações voltadas para infraestrutura e monitoramento dinâmico.
  • Fundamentos de SRE: Conhecimento prático aprofundado na aplicação dos pilares de Site Reliability Engineering (gerenciamento de ciclo de vida de incidentes, Budgets e métricas de SLI/SLO).
  • Arquitetura de Sistemas Distribuídos: Compreensão cristalina de padrões de Alta Disponibilidade (HA), Tolerância a Falhas e Resiliência arquitetural.
  • Diferencial: Infraestrutura como Código (IaC): Experiência prática com ferramentas de provisionamento declarativo como Terraform, Pulumi ou CloudFormation.
  • Observabilidade em Engenharia de Dados: Familiaridade com a infraestrutura e o comportamento de pipelines de Big Data (Apache Airflow, Spark ou similares) sob a ótica de confiabilidade e monitoramento de cargas de trabalho.
  • SecOps / DevSecOps: Conhecimento em conceitos de Observability-driven Security.
  • Certificações ativas de Arquitetura/DevOps AWS ou de Kubernetes.

Benefits

  • Cartão multi-benefícios – você escolhe como e onde utilizar.
  • Bolsas de Estudos para cursos de Graduação, Pós, MBA e Idiomas.
  • Programas de incentivo à Certificações.
  • Horário de trabalho flexível.
  • Salários competitivos.
  • Avaliação de desempenho anual com plano de carreira estruturado.
  • Possibilidade de carreira internacional.
  • Wellhub e TotalPass.
  • Previdência Privada.
  • Auxílio-Creche.
  • Assistência Médica.
  • Assistência Odontológica.
  • Seguro de Vida.

Related Categories

Related Job Pages

More DevOps Engineer Jobs

Circle logo

Senior Site Reliability Engineer

Circle

The all-in-one community platform for creators and brands. https://circle.so/

DevOps Engineer2 days ago
Full TimeRemoteTeam 51-200Since 2019H1B Sponsor

• Act as a first responder for system incidents and outages, helping Circle stay highly available and performant • Own and evolve our monitoring, alerting, and log management systems • Manage and optimize our database infrastructure (including MySQL, Postgres, Clickhouse, and Redis) • Maintain and improve our server infrastructure and deployment pipelines • Collaborate closely with engineering teams to build scalable, resilient systems • Contribute to internal SRE tooling and automation efforts

North America
$130K - $140K / year
SupportYourApp logo

DevOps Engineer, Fluent Ukrainian

SupportYourApp

SupportYourApp is an industry leader in premium outsourced customer support that provides tech companies with reliable, cost-effective services. A multinational

DevOps Engineer2 days ago

• Будувати, підтримувати та оптимізувати CI/CD pipelines для веб-продуктів, сайтів та внутрішніх сервісів компанії у Jenkins та GitLab CI/CD • Підтримувати поступову міграцію deployment processes з Jenkins на GitLab CI • Забезпечувати стабільні, repeatable та predictable deployments з rollback-механізмами і мінімальною кількістю manual steps • Налаштовувати та підтримувати Docker-based runtime environments для web applications та сервісів • Стандартизувати Docker, docker-compose, deployment scripts та runtime-конфігурації, щоб рішення не потребували регулярного rework • Адмініструвати Linux-сервери у production-середовищі: налаштування, patch management, troubleshooting, performance analysis • Автоматизовувати infrastructure setup, configuration management та maintenance-процеси через Ansible і Bash • Підтримувати web infrastructure: Nginx, SSL/TLS, reverse proxy, routing, Cloudflare, DNS, caching та базові security rules • Налаштовувати, підтримувати та покращувати monitoring, logging та alerting для production systems • Аналізувати deployment failures та production incidents, визначати root cause і пропонувати preventive actions • Підтримувати backup/restore, monitoring та базове troubleshooting для MySQL/PostgreSQL • Забезпечення reliability та stability production systems • Аналіз production incidents, проведення root cause analysis та впровадження preventive actions • Участь у post-incident reviews та підготовка технічних висновків після інцидентів • Впроваджувати та підтримувати security practices для Linux і web infrastructure: hardening, контроль доступів, оновлення, закриття вразливостей • Документувати інфраструктурні рішення, deployment workflows, конфігурації та важливі зміни • Узгоджувати production changes з командою, попереджати про ризики та не вносити критичні зміни без прозорої комунікації • Проактивно виявляти слабкі місця в deployment, infrastructure та application architecture, які можуть призвести до нестабільності, та ініціювати їх усунення.

Poland

Role Description Nous recherchons un.e Ingénieur.e de Fiabilité Senior.e – Fiabilité des Produits pour aider à mettre à l'échelle, exploiter et améliorer la fiabilité de notre plateforme de communication basée sur l'IA. Ce rôle se situe à l'intersection de l'ingénierie logicielle, de l'infrastructure, des opérations et du support produit. Vous serez responsable de garantir la stabilité, l'évolutivité et les performances des systèmes alimentant des milliers d'interactions en temps réel sur des architectures distribuées et événementielles. Vous servirez également de première couche d'investigation technique pour les incidents de production et les défaillances liées aux produits, en partenariat étroit avec les équipes d'ingénierie pour identifier les causes profondes, améliorer l'observabilité et favoriser des améliorations durables de la fiabilité. Ce rôle hautement technique et pratique convient à quelqu'un qui aime déboguer des systèmes complexes, améliorer l'excellence opérationnelle et construire une infrastructure fiable à grande échelle. Responsibilities - Servir comme première ligne d'investigation technique pour les incidents de production, les défaillances de produits et les problèmes de performance - Analyser les journaux, les traces, les métriques et le comportement du système pour identifier rapidement les causes profondes et implémenter des solutions - Collaborer étroitement avec les équipes d'ingénierie backend et DevOps pour diagnostiquer les problèmes affectant la stabilité, la latence et la fiabilité - Concevoir et mettre en œuvre des améliorations d'observabilité, y compris la surveillance, l'alerte et la journalisation structurée, à travers les systèmes distribués - Établir et améliorer les processus de réponse aux incidents, y compris les procédures d'escalade, l'analyse post-mortem et la prévention des incidents récurrents - Participer à la conception architecturale des services backend, des systèmes événementiels et des pipelines de messagerie asynchrone pour garantir la fiabilité et la récupération après sinistre - Optimiser les performances et la résilience des systèmes fonctionnant sous charge élevée, avec des milliers d'interactions en temps réel - Développer et maintenir la documentation opérationnelle, les runbooks et les dashboards pour soutenir les opérations en production - Collaborer avec les équipes de produit et de support client pour comprendre les impacts métier et les priorités - Mentorer les ingénieurs plus juniors sur les meilleures pratiques de fiabilité et les principes de conception résiliente Qualifications - 5+ années d'expérience en ingénierie de la fiabilité des sites, ingénierie de production, ingénierie backend ou rôles similaires - Expérience pratique solide avec Node.js et TypeScript dans des environnements de production - Expérience éprouvée dans l'exploitation et le dépannage des architectures de systèmes distribués et microservices - Expérience en gestion des charges de travail de production sur AWS, y compris ECS, Lambda, SQS et API Gateway - Expérience pratique avec Kafka, AWS SQS ou d'autres systèmes de messagerie/streaming d'événements - Compréhension solide des meilleures pratiques en observabilité, surveillance, alerte et réponse aux incidents - Expérience en débogage de problèmes complexes de production sur les couches application, infrastructure et réseau - Compréhension approfondie des concepts de fiabilité des systèmes, notamment la concurrence, les workflows asynchrones, la résilience, la tolérance aux pannes et la cohérence éventuelle - Expérience avec MongoDB et Redis dans des environnements de production à grande échelle - Capacité à analyser les journaux, les traces, les métriques et le comportement du système pour identifier rapidement les causes profondes - Fortes compétences en communication et capacité à collaborer entre les équipes d'ingénierie, produit et support - Expérience du mentorat d'ingénieurs et contribution aux initiatives d'excellence opérationnelle Nice to Have - Expérience avec Kubernetes et l'orchestration de conteneurs en production - Expérience plus large de l'infrastructure AWS (réseautage, infrastructure-as-code, observabilité, optimisation des coûts) - Expérience avec les bases de données relationnelles telles que PostgreSQL - Expérience en développement de tests de charge, de tests de résilience et d'exercices de chaos engineering - Expérience antérieure en support client ou en travail direct avec les clients pour comprendre les impacts métier Benefits - Rejoignez une équipe passionnée qui innove dans l'espace de l'IA pour l'automobile. - Travaillez à distance avec des horaires flexibles et une forte autonomie. - Contribuez à une entreprise en croissance où votre voix et votre impact comptent. - Rémunération compétitive et opportunités d'avancement. Salary Range 130-150k selon l'expérience

Worldwide
C$130K - C$150K / year
Full TimeRemoteTeam 10,001+H1B Sponsor

• Work on a strategic cloud modernization and migration program, supporting the evolution of the Client's Platform; • Plan and execute workload migrations from Azure to AWS in production and non-production environments; • Design, implement and maintain Infrastructure as Code (IaC) using Terraform and/or CloudFormation; • Structure and evolve CI/CD pipelines, ensuring automation, standardization and efficiency in deployment processes; • Configure, manage and optimize AWS services such as VPC, IAM, EC2, S3, Lambda, RDS, among others; • Implement secure deployment strategies, including Blue/Green Deployment, Canary Release and rollback plans; • Ensure platform observability through monitoring, metrics, centralized logging, distributed tracing and alerts; • Monitor performance, availability and stability of environments during migration windows; • Identify and resolve critical incidents, supporting troubleshooting actions in production environments; • Collaborate with Data Engineering, Development and Architecture teams to ensure workload compatibility and continuity; • Ensure the application of best practices in security, compliance and governance throughout the cloud transition process; • Contribute to building a modern, scalable, resilient and data-driven architecture.

Brazil