Extractta logo
Extractta

EXTRACTTA | Informações que geram Soluções

Engenheiro de IA Sênior

AI EngineerMachine Learning EngineerFull TimeRemoteMid LevelTeam 201-500Since 2005H1B No SponsorCompany SiteLinkedIn

Location

Brazil

Posted

3 days ago

Salary

0

Seniority

Mid Level

Bachelor Degree2 yrs expPortugueseDockerKubernetesPythonReact

Job Description

Engenheiro de IA Sênior

Extractta

• Mapear oportunidades em crédito e cobrança onde agentes de IA podem substituir ou ampliar processos manuais, considerando fluxos de trabalho, riscos operacionais e critérios de sucesso em ambientes regulados • Projetar e manter arquiteturas de **Retrieval Augmented Generation (RAG)**, alimentando agentes com informações precisas e atualizadas • Gerenciar pipelines de ingestão de dados não estruturados (PDFs, áudios, textos, imagens), incluindo OCR e extração de entidades • Desenvolver e orquestrar sistemas multi-agente utilizando frameworks como **LangGraph, CrewAI ou AutoGen** • Implementar padrões arquiteturais como **ReAct, Plan-and-Execute e Reflexion** • Integrar agentes com APIs internas, sistemas legados e fontes de dados de crédito e cobrança • Estruturar e versionar prompts de sistema, instrução e contexto com técnicas avançadas (**chain-of-thought, few-shot prompting, structured outputs, self-consistency**), garantindo comportamentos determinísticos e auditáveis • Avaliar a qualidade das respostas dos agentes com métricas especializadas (**Faithfulness, Answer Relevancy, Context Precision, Hallucination Rate**) • Implementar **guardrails** e camadas de segurança para prevenção de alucinações, prompt injection e vazamento de dados sensíveis, em conformidade com a LGPD • Operar pipelines de **LLMOps** para monitoramento contínuo de custos, latência, qualidade e drift comportamental dos agentes em produção • Garantir versionamento de prompts, modelos e bases de conhecimento com rastreabilidade completa • Acompanhar o desempenho dos agentes em produção, iterando sobre base de conhecimento, lógica de orquestração e estratégias de fallback • Medir o impacto em KPIs de negócio (redução de tempo de análise de crédito, aumento na taxa de recuperação, melhoria na experiência do cliente) • Elaborar documentação técnica conforme padrões internos e exigências regulatórias, garantindo auditabilidade das decisões automatizadas

Job Requirements

  • Ensino Superior Completo em Ciências da Computação, Engenharia, Matemática, Estatística ou áreas afins
  • 2+ anos de experiência em desenvolvimento de software ou sistemas de IA
  • Experiência sólida com **LLMs** (OpenAI GPT-4o, Anthropic Claude, Google Gemini, Meta Llama)
  • Experiência com frameworks de orquestração multi-agente (**LangGraph, CrewAI, AutoGen** ou similares)
  • Domínio de **arquitetura RAG**: chunking, indexação semântica, busca híbrida (dense + sparse), reranking e bancos de dados vetoriais
  • Domínio de **Python** para desenvolvimento de aplicações de produção
  • Sólidos conhecimentos em **APIs REST**, design de microserviços, **Docker, Kubernetes e Git (Gitflow)**
  • Experiência com testes automatizados (unitários, de integração e de comportamento de agentes)
  • Domínio de técnicas avançadas de **Prompt Engineering** (chain-of-thought, few-shot, structured outputs, tool use, self-consistency)
  • Familiaridade com frameworks de avaliação de LLMs (**Ragas, DeepEval, PromptFoo** ou similares)
  • Conhecimento em **OWASP Top 10 for LLMs**, técnicas de detecção de prompt injection, PII masking e implementação de guardrails (**Guardrails AI, NeMo Guardrails** ou similares)
  • Experiência com ingestão e processamento de dados não estruturados (PDFs, contratos, extratos, áudios transcritos)
  • Inglês técnico para leitura de papers, documentações e normativos internacionais.

Benefits

  • Vale Alimentação e/ou Vale Refeição;
  • Convênio Sesi e Sesc, oferecendo acesso a serviços de saúde, bem-estar e lazer;
  • Parceria com Instituições de Ensino, com descontos exclusivos em cursos e programas educacionais;
  • Possibilidade de crescimento na empresa e de participação em projetos estratégicos;
  • Oportunidade de trabalhar em uma empresa do mercado em plena expansão.

Related Job Pages

More AI Engineer Jobs

Affinity.co logo

Senior AI Engineer

Affinity.co

The CRM for Deal Makers. Relationship Intelligence, Reimagined.

AI Engineer3 days ago
Full TimeRemoteTeam 201-500Since 2014H1B No Sponsor

• Architect, prototype, and deploy RAG pipelines, combining vector search, hybrid retrieval, reranking and contextual compression techniques. • Contribute to design and orchestration of multi-agent LLM systems using community frameworks and custom orchestration layers. • Work on a variety of information extraction, information storage and information retrieval problems for both structured and unstructured data. • Partner with cross-functional (product, infra, data engineering, and software engineering) to build robust, high-scale systems that underlie all of our data processing and ML Operations.

Canada
$160K - $220K / year
Coinbase logo

Senior Software Engineer – AI Platform Team

Coinbase

A digital currency exchange, Coinbase is used by consumers, merchants, and traders to buy and sell cryptocurrencies, such as Bitcoin, Ethereum, and Litecoin. Fo

AI Engineer3 days ago
Full TimeRemoteTeam 4,700Since 2012

• Build and operate the LLM and agent infrastructure every team at Coinbase builds on. • Ship high impact AI agents on top of the LLM infrastructure. • Serve as the company's single path to LLMs and the substrate for the full agent lifecycle: build, deploy, run, observe, improve.

United States
Leega logo

Senior AI Engineer – Agentes, Plataforma & RAG

Leega

Inteligência, Inovação e Tecnologia.

AI Engineer3 days ago
Full TimeRemoteTeam 201-500Since 2010H1B No Sponsor

• Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver). • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real. • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos. • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade. • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência. • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM. • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).

Brazil
Jalasoft logo

AI Tech Lead

Jalasoft

We provide the best software engineering solutions by investing in our people first.

AI Engineer3 days ago
Full TimeRemoteTeam 1,001-5,000Since 2003H1B No Sponsor

• Serving as Scrum Master and Delivery Lead for both AI teams: organizing and facilitating sprint planning, daily stand-ups, backlog grooming, and retrospectives. • Shielding both teams from day-to-day integration distractions by ensuring the junior development team receives clean task definitions, structured schemas, and clearly scoped technical requirements. • Balancing high-speed AI prototyping demands against the structured pipeline stabilization cycles required for enterprise-grade development. • Managing cross-team dependency and interface mapping to ensure smooth collaboration between the senior and junior engineering layers. • Translating strict architectural guardrails — network isolation, database connection limits, cost-containment — from the System Architects into practical workflows for the engineering teams. • Partnering with Loftware Architects to ensure teams safely leverage AWS services and data read replicas without compromising corporate security boundaries, tenant isolation, or regional compliance. • Leading technical review sessions to determine the appropriate storage strategy (Amazon MemoryDB / Redis OSS / Valkey vs. pgvector vs. OpenSearch), balancing developer needs against enterprise infrastructure standards. • Overseeing evaluation frameworks for multi-step agent workflows to ensure deterministic behavior and eliminate unhandled hallucinations. • Validating that all data ingestion flows and internal tool-calling structures adhere to type-safe validation layers, preventing malformed agent responses from breaking downstream systems or leaking PII. • Overseeing the centralized repository for system prompts, prompt caching strategies, and Amazon Bedrock configurations to ensure optimal performance, token budgeting, and corporate policy alignment. • Working with internal teams to define and enforce robust CI/CD strategies for AI agents, ensuring that changes to prompts, embeddings, or state-machine routing rules are deployed without service disruption. • Contributing to operational protocols for deployment failures mid-workflow, ensuring both teams design for idempotency to handle unexpected model degradation or pipeline failures gracefully.

Colombia