Mapa da trilha
🎯 Por que orquestrador?
90,2% melhor que solo
👔 Chief-of-staff pattern
Padrão Anthropic
🤖 Subagents e especialistas
CFO, CMO, Ops Bot
🌐 A2A — agent-to-agent
Protocolo Google
🧰 Cross-framework patterns
LangGraph, CrewAI, AutoGen
🚦 Quando criar (e não criar) agente
Hire-when-needed
Conteúdo detalhado
🎯 Por que orquestrador? (90,2% melhor)
Anthropic mediu: multi-agent (Opus 4 lead + Sonnet 4 workers) supera single-agent em 90,2%.
Avaliação interna da Anthropic: multi-agent superou single-agent em 90,2% das tarefas de pesquisa.
Não é hype — é métrica reproduzível em pesquisa publicada.
Multi-agent research system, eval, parallel exploration.
Lead agent decompõe a tarefa, workers executam em paralelo, lead sintetiza.
Define a divisão clássica: pensar × fazer.
Plan-execute, decomposition, synthesis.
Multi-agent custa ~5-15x mais tokens que single-agent. Justificável quando qualidade importa.
Saber quando vale.
Token cost, value × cost, eval-driven.
Sem hierarquia, agentes se sobrepõem. Hierarquia define quem chama quem.
Linha plana = caos. Hierarquia = clareza.
Hierarchy, ownership, accountability.
Workers executam subtasks em paralelo. Tempo total ≈ tempo do mais lento + síntese.
Reduz latência sem reduzir qualidade.
Map-reduce, parallel exec, fan-out/fan-in.
Tarefas simples e bem definidas: single-agent é mais rápido e barato.
Multi-agent vira overengineering em 80% dos casos.
YAGNI, simplicity-first, eval before scale.
👔 Chief-of-staff pattern
O EA que recebe pedido bruto e roteia ao especialista certo. Padrão pacote da Anthropic.
Agente que recebe pedido em linguagem natural, classifica e roteia.
Cliente fala UM lugar; sistema decide quem responde.
Single entry point, routing, classification.
EA usa LLM para classificar intenção e escolher subagente.
Roteamento manual não escala.
Intent classification, dispatcher, fallback.
Pergunta complexa → CFO Bot + CMO Bot + Ops Bot → EA sintetiza.
É o que diferencia chatbot de orquestrador.
Chain, fan-out, synthesis.
Lista todos os subagentes disponíveis, suas funções, escopo e SLA.
Sem catálogo, EA não sabe pra quem rotear.
Agent registry, capability catalog, SLA.
EA define timeout por chamada e plano B (outro agente, humano).
Sistema sem fallback fica trancado em loops.
Timeout, retry, fallback, circuit breaker.
Toda decisão fora do escopo, alta-stakes ou ambígua escala para humano.
EA bom sabe quando NÃO decidir.
Escalation, human-in-the-loop, ambiguity detection.
🤖 Subagents e especialistas
CFO Bot, CMO Bot, Ops Bot, Researcher, Builder, Communicator. Cada um com função, escopo e SLA.
Nome, função, escopo, ferramentas, Silver Platters lidos, output esperado.
Padronização permite reuso e auditoria.
Identity card, scope, deliverable.
Lê /finance Silver Platters. Análise de margem, fluxo de caixa, alertas.
Especialista isolado erra menos que generalista.
Domain isolation, KPI ownership.
Lê /marketing — campanhas, audiência, voz do cliente.
Marketing exige tom; isolar dá consistência.
Brand voice, attribution, customer voice.
Ops (operações, estoque, logística), Researcher (descoberta), Builder (entrega técnica).
Mostra que o padrão se replica em qualquer função.
Role taxonomy, agent specialization.
Definidos em ~/.claude/agents/*.md. Tool Agent invoca por tipo.
Saber a sintaxe permite criar seus próprios.
Agents folder, frontmatter, dispatch.
Cada agente tem casos-teste com saída esperada. Regressão controlada.
Sem eval por papel, mudança em um afeta outros sem perceber.
Eval suite, regression test, golden examples.
🌐 A2A — Agent-to-Agent Protocol
Google, abr/2025. 150+ parceiros. 22k+ stars. Camada de rede entre agentes — complementar ao MCP.
MCP = agente↔ferramenta. A2A = agente↔agente. Camadas distintas, ambas necessárias.
Confundir os dois leva a arquitetura errada.
Tool layer × peer layer.
JSON com nome, descrição, capacidades, autenticação, endpoint.
É o "DNS" da rede de agentes.
Capability discovery, agent registry, identity.
A2A usa HTTP para request, SSE para streaming, JSON-RPC para chamadas.
Baseado em padrões web — não reinventa roda.
HTTP, SSE, JSON-RPC 2.0.
OAuth, mTLS, API keys assinadas. Identidade verificável.
Agentes não-autenticados são vetor de abuso.
OAuth, mTLS, signed keys.
Agentes de empresas diferentes negociando. Marketplaces de agentes. Federações.
É onde o futuro do B2B agêntico está acontecendo.
Inter-org, marketplace, federation.
SDKs em Python, JS, Java, Go, .NET. Adoção crescendo em enterprise.
Ficar à frente das integrações que estão chegando.
Roadmap, SDK, ecosystem.
🧰 Padrões cross-framework
LangGraph, CrewAI, AutoGen, OpenAI Agents SDK — todos convergiram para o mesmo padrão. Saber traduzir.
Orquestrador como nó central de decisão em grafo. Audit trail e rollback nativos.
Adoção enterprise crescente — produção em escala.
DAG, supervisor, state machine.
Crew = equipe. Manager agent coordena workers. Foco em easy-to-start.
Curva de aprendizado mais suave que LangGraph.
Crew, role-based, manager.
Microsoft. GroupChat com GroupChatManager. Conversa entre agentes em rounds.
Bom para casos de debate / refinamento iterativo.
Round-based, debate, refinement.
Agente A "passa" controle para Agente B. Handoff explícito.
Padrão simples e direto.
Handoff, baton-passing, explicit transfer.
Cérebro LangGraph orquestra crew CrewAI chamando tools OpenAI. Ecossistema mesclado.
É o futuro: não escolher um framework, mas compor.
Polyglot, mesh, interop.
LangGraph (produção, controle), CrewAI (start rápido), AutoGen (debate), Claude Code subagents (CLI nativo).
Cada caso pede uma escolha.
Trade-off, fit-for-purpose.
🚦 Quando criar (e quando NÃO criar) agente
Hire-when-needed. Cada agente é overhead — só justificável se há carga real e função distinta.
Carga regular (semanal+), função distinta, dados isolados, eval mensurável.
Sem critério, vira coleção de bots inúteis.
Demand-driven, distinct function, evaluable.
"Pra eu testar", overlap óbvio, sem dados, sem dono humano, sem eval.
Resistir à tentação salva tempo e tokens.
YAGNI, overlap, no-eval = no-go.
Se 1 skill cobre, fica skill. Se vira família de skills + decisão, promove a agente.
Promoção evita over-engineering inicial.
Skill → agent promotion path.
Demanda caiu? Eval piora? Outro cobriu? Aposenta — não acumula zumbi.
Lifecycle completo evita arquitetura cheia de fantasmas.
Lifecycle, decommission, sunset.
Tempo poupado, taxa de aceitação humana, custo por execução, satisfação do dono.
Sem KPI, decisão de manter/aposentar é subjetiva.
ROI, acceptance rate, cost-per-run.
Para empreendedor solo: 3-5 agentes. PME: 5-10. Enterprise: 10-30.
Saber o tamanho saudável.
Right-size, lean roster, scaling curve.