Padrões de design multi-agente: os quatro que funcionam em produção
Sequencial, orchestrator-worker, hierárquico e handoff dinâmico — os quatro padrões multi-agente usados em produção em 2026, com orientações de implementação em LangGraph para cada um.
Seção 01 · Por que padrões importam
Por que escolher o padrão errado sai caro
Um sistema multiagente construído sobre o padrão errado não falha de forma óbvia — ele entrega devagar, roda caro e quebra de forma intermitente, de um jeito difícil de reproduzir.
Resposta rápida
A resposta curta: Padrões de design multiagente definem como agentes se comunicam, coordenam e passam estado. O padrão escolhido determina o custo, a confiabilidade e a depurabilidade do sistema. Escolha errado e você passa o resto do projeto lutando contra bugs de coordenação.
Em 2026, 57 por cento das empresas implantam workflows multiagentes, mas a maioria os engendra ad hoc — agentes chamando agentes, filas de mensagens parafusadas por cima, estado passado de jeitos que faziam sentido nas primeiras cinco chamadas mas quebram na sexagésima. Os incidentes de produção quase sempre rastreiam até um problema de padrão de coordenação, não um problema de modelo.
A boa notícia: existem quatro padrões que cobrem a vasta maioria dos casos de uso multiagentes em produção. Saber qual deles encaixa no seu problema antes de começar a construir poupa semanas de retrabalho arquitetural.
Seção 02 · Padrão 1
Sequencial: pipelines lineares onde a ordem importa
O padrão sequencial é uma cadeia: o Agente A roda, passa a saída para o Agente B, que passa para o Agente C. Cada passo pode acessar as saídas de todos os passos anteriores. Sem paralelismo. Sem decisões de roteamento. O grafo é fixo no momento do design.
Use quando
Cada passo depende da saída do anterior, o workflow é previsível e não se ramifica, e simplicidade e depurabilidade pesam mais que throughput. Pipelines de processamento de documentos — ingerir, extrair, classificar, resumir, armazenar — são o exemplo canônico.
Evite quando
Os passos são independentes uns dos outros e poderiam rodar em paralelo. Rodar passos independentes em sequência desperdiça tempo e adiciona latência sem benefício. Se A, B e C não dependem um do outro, use orchestrator-worker em vez disso.
Seção 03 · Padrão 2
Orchestrator-worker: despacho paralelo para subtarefas independentes
O padrão orchestrator-worker tem um orquestrador central que decompõe um objetivo em subtarefas independentes, despacha para workers especializados em paralelo, espera os resultados e sintetiza uma saída final. O tempo de relógio é o tempo da subtarefa mais lenta, não a soma de todas.
Use quando
O objetivo pode ser decomposto em subtarefas independentes que não dependem das saídas umas das outras. Workflows de pesquisa — coletar dados de 10 fontes simultaneamente, depois sintetizar — são o exemplo canônico. O orquestrador despacha as 10 buscas em paralelo em vez de em sequência.
Evite quando
As subtarefas são interdependentes e precisam executar em ordem. Orchestrator-worker adiciona overhead de coordenação — o orquestrador precisa rastrear o estado de todos os workers, lidar com falhas parciais e gerenciar a síntese. Para workflows lineares, sequencial é mais simples e igualmente rápido.
No LangGraph, isso é implementado com a Send API: o nó orquestrador faz fan out para nós workers enviando mensagens tipadas simultaneamente. O grafo coleta todas as respostas no estado compartilhado antes do nó de síntese rodar. Esse é hoje o padrão de implementação canônico — infraestrutura customizada de troca de mensagens não é mais necessária.
Seção 04 · Padrão 3
Hierárquico: agentes supervisores para workflows multi-domínio complexos
O padrão hierárquico introduz agentes supervisores entre o orquestrador e os workers. Um orquestrador de nível superior delega para supervisores de domínio. Cada supervisor gerencia os workers do seu domínio. Os resultados sobem a hierarquia até o sintetizador de nível superior.
Use quando
O problema cobre múltiplos domínios distintos — pesquisa jurídica, análise financeira e avaliação técnica, por exemplo — onde cada domínio tem ferramentas especializadas e exige raciocínio específico. Uma estrutura orchestrator-worker plana exigiria que o orquestrador entendesse os três domínios. Uma estrutura hierárquica delega esse entendimento aos supervisores de domínio.
Evite quando
O workflow é mono-domínio e a hierarquia adicionada cria coordenação sem agregar capacidade. Sistemas hierárquicos são bem mais complexos de depurar: uma falha em um worker pode aparecer como erro ambíguo no nível do supervisor. Introduza hierarquia somente quando a complexidade do problema justifica.
Seção 05 · Padrão 4
Handoff dinâmico: roteamento em tempo de execução com base no contexto
O handoff dinâmico permite que agentes transfiram controle para outros agentes em tempo de execução com base no estado da conversa ou da tarefa — sem grafo fixo. O agente decide a cada passo quem deve assumir o próximo, com base no contexto atual.
Use quando
O workflow não pode ser totalmente definido em tempo de design porque o próximo passo depende de resultados intermediários. Agentes de atendimento ao cliente que roteiam para agentes especializados conforme o tipo e a severidade da issue são o exemplo canônico. A lógica de roteamento vive no raciocínio do modelo, não na estrutura do grafo.
Evite quando
A lógica de roteamento pode ser expressa como grafo fixo. Roteamento dinâmico é poderoso, mas cria imprevisibilidade: é mais difícil de testar exaustivamente, mais difícil de auditar e mais difícil de depurar quando o modelo roteia de forma inesperada. Prefira padrões fixos quando possível e use handoff dinâmico só quando flexibilidade for essencial.
Seção 06 · Implementação
LangGraph: o default de produção para os quatro padrões
LangGraph implementa os quatro padrões nativamente. Cadeias sequenciais mapeiam diretamente para arestas lineares do grafo. Orchestrator-worker usa a Send API para despacho paralelo. Arquiteturas hierárquicas usam subgrafos com fronteiras de estado tipadas entre níveis. Handoff dinâmico usa arestas condicionais que roteiam com base nos valores do estado em tempo de execução.
As propriedades-chave que tornam LangGraph o default em produção: estado tipado (você não passa acidentalmente dados malformados entre agentes), persistência embutida (o estado dos agentes sobrevive a reinícios de processo) e o sistema de checkpoints (você pode inspecionar, depurar e re-executar qualquer passo de qualquer run). Essas são as features que importam quando algo dá errado às 3 da manhã em produção.
Para entender como esses padrões se encaixam em uma arquitetura agêntica completa em produção, veja meu serviço de consultoria em IA agêntica que cobre design de orquestração como parte da entrega completa do sistema.
FAQ
Perguntas frequentes
Quais são os principais padrões de design multiagente em 2026?
Os quatro padrões canônicos são sequencial (pipeline ordenado), orchestrator-worker (despacho paralelo), hierárquico (agentes supervisores gerenciando agentes workers) e handoff dinâmico (roteamento em tempo de execução com base no contexto). LangGraph suporta os quatro nativamente e é o framework default de produção em 2026.
Quando devo usar o padrão orchestrator-worker?
Use orchestrator-worker quando o objetivo pode ser decomposto em subtarefas independentes que não dependem das saídas umas das outras. O padrão roda subtarefas em paralelo, reduzindo o tempo total de relógio ao da subtarefa mais lenta em vez da soma. Workflows de pesquisa, pipelines de geração de conteúdo e enriquecimento paralelo de dados são casos de uso comuns.
Qual a diferença entre sistemas multiagentes hierárquicos e orchestrator-worker?
Orchestrator-worker tem dois níveis: um orquestrador e workers. Hierárquico tem três ou mais níveis: um orquestrador de nível superior, supervisores de domínio e workers. Use hierárquico quando o problema cobre múltiplos domínios distintos que exigem cada um raciocínio e ferramentas especializados. Use orchestrator-worker para despacho paralelo mais simples.
Como implementar padrões multiagentes em LangGraph?
LangGraph implementa padrões sequenciais como arestas lineares do grafo, orchestrator-worker via Send API para fan out paralelo, padrões hierárquicos via subgrafos com fronteiras de estado tipadas e handoff dinâmico via arestas condicionais que avaliam o estado em tempo de execução. O objeto de estado tipado compartilhado é a chave: todos os agentes leem e escrevem na mesma estrutura tipada.
Perguntas frequentes
- Quais são os principais padrões multi-agente em 2026?
- Os quatro padrões canônicos são sequencial (pipeline ordenado), orchestrator-worker (despacho em paralelo), hierárquico (agentes supervisores controlando agentes workers) e handoff dinâmico (roteamento em tempo de execução com base no contexto). LangGraph suporta todos nativamente e é o framework padrão de produção em 2026.
- Quando usar o padrão orchestrator-worker?
- Use orchestrator-worker quando o objetivo puder ser decomposto em subtarefas independentes que não dependem uma da outra. O padrão executa as subtarefas em paralelo, reduzindo o wall-clock total ao tempo da subtarefa mais lenta em vez da soma de todas.
- Qual a diferença entre hierárquico e orchestrator-worker?
- Orchestrator-worker tem dois níveis: um orchestrator e workers. O hierárquico tem três ou mais: um orchestrator de topo, supervisores por domínio e workers. Use hierárquico quando o problema atravessa vários domínios distintos que exigem raciocínio e ferramental especializados.
- Como implementar esses padrões em LangGraph?
- LangGraph implementa o sequencial como arestas lineares, o orchestrator-worker via API Send para fan-out paralelo, o hierárquico via subgraphs com fronteiras de estado tipadas e o handoff dinâmico via arestas condicionais avaliadas em runtime.