EXTRACTTA | Informações que geram Soluções
Engenheiro de IA Sênior
Location
Brazil
Posted
3 days ago
Salary
0
Seniority
Mid Level
Job Description
Engenheiro de IA Sênior
Extractta
• Mapear oportunidades em crédito e cobrança onde agentes de IA podem substituir ou ampliar processos manuais, considerando fluxos de trabalho, riscos operacionais e critérios de sucesso em ambientes regulados • Projetar e manter arquiteturas de **Retrieval Augmented Generation (RAG)**, alimentando agentes com informações precisas e atualizadas • Gerenciar pipelines de ingestão de dados não estruturados (PDFs, áudios, textos, imagens), incluindo OCR e extração de entidades • Desenvolver e orquestrar sistemas multi-agente utilizando frameworks como **LangGraph, CrewAI ou AutoGen** • Implementar padrões arquiteturais como **ReAct, Plan-and-Execute e Reflexion** • Integrar agentes com APIs internas, sistemas legados e fontes de dados de crédito e cobrança • Estruturar e versionar prompts de sistema, instrução e contexto com técnicas avançadas (**chain-of-thought, few-shot prompting, structured outputs, self-consistency**), garantindo comportamentos determinísticos e auditáveis • Avaliar a qualidade das respostas dos agentes com métricas especializadas (**Faithfulness, Answer Relevancy, Context Precision, Hallucination Rate**) • Implementar **guardrails** e camadas de segurança para prevenção de alucinações, prompt injection e vazamento de dados sensíveis, em conformidade com a LGPD • Operar pipelines de **LLMOps** para monitoramento contínuo de custos, latência, qualidade e drift comportamental dos agentes em produção • Garantir versionamento de prompts, modelos e bases de conhecimento com rastreabilidade completa • Acompanhar o desempenho dos agentes em produção, iterando sobre base de conhecimento, lógica de orquestração e estratégias de fallback • Medir o impacto em KPIs de negócio (redução de tempo de análise de crédito, aumento na taxa de recuperação, melhoria na experiência do cliente) • Elaborar documentação técnica conforme padrões internos e exigências regulatórias, garantindo auditabilidade das decisões automatizadas
Job Requirements
- Ensino Superior Completo em Ciências da Computação, Engenharia, Matemática, Estatística ou áreas afins
- 2+ anos de experiência em desenvolvimento de software ou sistemas de IA
- Experiência sólida com **LLMs** (OpenAI GPT-4o, Anthropic Claude, Google Gemini, Meta Llama)
- Experiência com frameworks de orquestração multi-agente (**LangGraph, CrewAI, AutoGen** ou similares)
- Domínio de **arquitetura RAG**: chunking, indexação semântica, busca híbrida (dense + sparse), reranking e bancos de dados vetoriais
- Domínio de **Python** para desenvolvimento de aplicações de produção
- Sólidos conhecimentos em **APIs REST**, design de microserviços, **Docker, Kubernetes e Git (Gitflow)**
- Experiência com testes automatizados (unitários, de integração e de comportamento de agentes)
- Domínio de técnicas avançadas de **Prompt Engineering** (chain-of-thought, few-shot, structured outputs, tool use, self-consistency)
- Familiaridade com frameworks de avaliação de LLMs (**Ragas, DeepEval, PromptFoo** ou similares)
- Conhecimento em **OWASP Top 10 for LLMs**, técnicas de detecção de prompt injection, PII masking e implementação de guardrails (**Guardrails AI, NeMo Guardrails** ou similares)
- Experiência com ingestão e processamento de dados não estruturados (PDFs, contratos, extratos, áudios transcritos)
- Inglês técnico para leitura de papers, documentações e normativos internacionais.
Benefits
- Vale Alimentação e/ou Vale Refeição;
- Convênio Sesi e Sesc, oferecendo acesso a serviços de saúde, bem-estar e lazer;
- Parceria com Instituições de Ensino, com descontos exclusivos em cursos e programas educacionais;
- Possibilidade de crescimento na empresa e de participação em projetos estratégicos;
- Oportunidade de trabalhar em uma empresa do mercado em plena expansão.
Related Guides
Related Job Pages
More AI Engineer Jobs
• Architect, prototype, and deploy RAG pipelines, combining vector search, hybrid retrieval, reranking and contextual compression techniques. • Contribute to design and orchestration of multi-agent LLM systems using community frameworks and custom orchestration layers. • Work on a variety of information extraction, information storage and information retrieval problems for both structured and unstructured data. • Partner with cross-functional (product, infra, data engineering, and software engineering) to build robust, high-scale systems that underlie all of our data processing and ML Operations.
Senior Software Engineer – AI Platform Team
CoinbaseA digital currency exchange, Coinbase is used by consumers, merchants, and traders to buy and sell cryptocurrencies, such as Bitcoin, Ethereum, and Litecoin. Fo
• Build and operate the LLM and agent infrastructure every team at Coinbase builds on. • Ship high impact AI agents on top of the LLM infrastructure. • Serve as the company's single path to LLMs and the substrate for the full agent lifecycle: build, deploy, run, observe, improve.
• Você vai construir a plataforma de agentes de IA da Guanabara e o ecossistema que distribui IA generativa governada à companhia. • Orquestração de agentes — construir agentes com LangGraph no padrão Supervisor/ReAct, com memória de curto/longo prazo e estado durável (PostgresSaver). • Camada semântica e RAG — evoluir a camada semântica determinística (Cube.js) e a recuperação semântica com Qdrant (busca vetorial + re-ranking) que ancoram as respostas em dado real. • Skills, subagentes e MCP — criar e versionar skills (SKILL.md), subagentes e ferramentas MCP (FastMCP) para o Claude Code, em fluxo spec-driven, conectando agentes a sistemas corporativos. • Verificação e avaliação — manter o verificador (LLM-as-judge) e suítes de eval (offline/online) com amostragem de traces para pegar drift de qualidade. • Plataforma de modelos — operar o gateway LiteLLM (Virtual Keys, budget, RBAC, roteamento multi-provider) otimizando custo e latência. • Adaptação e serving de modelos — quando RAG e prompting não bastam, fazer fine-tuning supervisionado e PEFT (LoRA/QLoRA), quantização e destilação; servir modelos abertos/privados com vLLM e roteamento SLM↔LLM. • Governança e segurança — aplicar guardrails de PII (Presidio), defesa contra prompt injection e observabilidade ponta a ponta (Langfuse).
AI Tech Lead
JalasoftWe provide the best software engineering solutions by investing in our people first.
• Serving as Scrum Master and Delivery Lead for both AI teams: organizing and facilitating sprint planning, daily stand-ups, backlog grooming, and retrospectives. • Shielding both teams from day-to-day integration distractions by ensuring the junior development team receives clean task definitions, structured schemas, and clearly scoped technical requirements. • Balancing high-speed AI prototyping demands against the structured pipeline stabilization cycles required for enterprise-grade development. • Managing cross-team dependency and interface mapping to ensure smooth collaboration between the senior and junior engineering layers. • Translating strict architectural guardrails — network isolation, database connection limits, cost-containment — from the System Architects into practical workflows for the engineering teams. • Partnering with Loftware Architects to ensure teams safely leverage AWS services and data read replicas without compromising corporate security boundaries, tenant isolation, or regional compliance. • Leading technical review sessions to determine the appropriate storage strategy (Amazon MemoryDB / Redis OSS / Valkey vs. pgvector vs. OpenSearch), balancing developer needs against enterprise infrastructure standards. • Overseeing evaluation frameworks for multi-step agent workflows to ensure deterministic behavior and eliminate unhandled hallucinations. • Validating that all data ingestion flows and internal tool-calling structures adhere to type-safe validation layers, preventing malformed agent responses from breaking downstream systems or leaking PII. • Overseeing the centralized repository for system prompts, prompt caching strategies, and Amazon Bedrock configurations to ensure optimal performance, token budgeting, and corporate policy alignment. • Working with internal teams to define and enforce robust CI/CD strategies for AI agents, ensuring that changes to prompts, embeddings, or state-machine routing rules are deployed without service disruption. • Contributing to operational protocols for deployment failures mid-workflow, ensuring both teams design for idempotency to handle unexpected model degradation or pipeline failures gracefully.




