Como gerenciar escalonamentos de suporte com IA
Alicia Kirana Utomo
Katelin Teen
Última edição June 17, 2026

O escalonamento e a parte dificil, nao uma reflexao tardia
Aqui esta o que a maioria dos guias de "implantar um agente de IA" ignora. A parte impressionante de um agente de IA (responder bem) e os 80% faceis. A parte que decide se os clientes confiam em voce e os entediantes 20%: saber quando parar e chamar uma pessoa. Um dos threads mais citados em r/AI_Agents coloca isso perfeitamente, com o titulo sozinho sendo referenciado em todo o subreddit: "A parte mais dificil de construir um agente de IA e fazer com que ele transfira para um humano". O ponto do postador original: todos otimizam para agentes mais inteligentes e autonomos, e ninguem faz a engenharia sem glamour de quando e como deve desistir.
Os clientes sentem essa lacuna imediatamente. Observe que quase toda historia viral de "odeio esse chatbot" nao e sobre a IA sendo burra, e sobre ficar preso sem saida. A comunidade ate aprendeu a explorar gatilhos frageis, como o truque da Verizon no r/lifehacks: diga "falar com um humano" e nada acontece, xingue e voce vai direto para a fila. Quando a a16z enquadrou toda a categoria, Sarah Wang liderou com a dor real do usuario: "Voce digitou furiosamente em um chatbot nao inteligente que nao e programado para saber sobre o que voce esta com raiva." A transferencia e o produto.
Portanto, este guia trata o escalonamento como um problema de design de primeira classe. Vamos gatilho por gatilho, depois transferencia, depois medicao, depois os erros que vemos com mais frequencia. Se voce quiser o aprofundamento conceitual junto com este como-fazer, nossa visao geral do escalonamento de chat com IA combina bem com ele, e se voce esta comparando como diferentes ferramentas lidam com isso, nosso resumo de escalonamento de chatbot vai plataforma por plataforma.
Quando um agente de IA deve escalonar? Os cinco gatilhos
Nao ha uma regra de escalonamento, ha cinco, e os melhores sistemas configuram todas elas. As equipes que implementam apenas uma (geralmente um limiar de confianca) sao as que acabam com clientes presos. Se voce so vai ler uma coisa sobre isso, leia nossa analise de quando transferir de IA para um humano.

- Solicitacao explicita de um humano. Inegociavel, e a que as equipes violam com mais frequencia. Quando um cliente pede uma pessoa, escalone imediatamente sem loop de confirmacao e sem nova tentativa. A Salesforce conecta isso na camada do classificador de topicos para que "ignore a logica interna para disparar uma transferencia imediatamente", e detalhamos esse fluxo especifico em nosso guia de escalonamento de IA do Salesforce. Enterrar esse caminho e uma das maneiras mais rapidas de destruir a confianca.
- Baixa confianca ou uma lacuna de conhecimento. Se o modelo nao tem certeza se entende a intencao, ou a busca nao encontrou nada em seus documentos, deve transferir em vez de adivinhar. A Gorgias documenta isso claramente: seu AI "nao vai especular alem" de suas fontes conectadas, e "se nao conseguir encontrar uma resposta relevante, transfere em vez de adivinhar".
- Frustracao ou sentimento hostil. Frases como "isso nao esta ajudando" sao um sinal para pedir desculpas e transferir antes que o cliente desista com raiva, um padrao que o Social Intents recomenda observar explicitamente.
- Topicos sensiveis, independentemente da confianca. Reembolsos, disputas de cobranca, ameacas legais, fraude, perguntas medicas, qualquer coisa envolvendo movimentacao de dinheiro ou identidade. A Gorgias codifica uma transferencia em "mencoes de autolesao, ameacas de violencia, ameacas de acao legal e solicitacoes envolvendo detalhes de contas financeiras". O CX Today chama isso de "pontuacao de risco", e e separado da confianca: mesmo um bot confiante nao deve resolver automaticamente um estorno.
- Acoes que precisam de aprovacao humana. Qualquer coisa irreversivel (emitir um reembolso, excluir dados, aprovar um desconto) deve escalonar independentemente de quao confiante o agente diz estar. E de forma critica, essa regra de aprovacao deve residir no fluxo de trabalho, nao no julgamento da IA, porque se a IA decide se sua propria acao precisa de aprovacao, um prompt persuasivo pode convence-la a nao perguntar.
Um cliente da eesel resumiu todo o objetivo em uma chamada de vendas. Um gerente de suporte em um servico de rastreamento de onibus que processa 200 a 250 tickets por mes no Zendesk nos disse que queria que a IA "gerenciasse 60% dos tickets entrantes do Zendesk e soubesse quando chamar uma pessoa real." Essa ultima clausula e o trabalho completo. Saber quando chamar uma pessoa e o que separa um agente de helpdesk de IA em que voce pode confiar de uma maquina de deflexao que silenciosamente irrita as pessoas.
Etapa 1: Nao dependa da confianca como unico gatilho
O roteamento por confianca e o gatilho de menor atrito e o mais facil de configurar errado. A armadilha e que a confianca do modelo e sistematicamente superestimada. Como o guia de escalonamento 2026 da Digital Applied coloca, modelos treinados com RLHF sao mal calibrados, entao uma confianca declarada de 90% frequentemente corresponde a algo mais proximo de 75% de precisao real. Defina um limiar ingenuo e voce enviara um fluxo de respostas confiantes mas incorretas.
A solucao nao e abandonar a confianca, e torna-la uma entrada entre tres. O modelo do CX Today e o mais claro: combine confianca (entende, a resposta e correta), risco (o topico e sensivel demais para automatizar mesmo se confiante) e esforco (novas tentativas, intencoes repetidas, frustracao crescente, palavras-chave de "agente"). O esforco e o subestimado. Tentativas repetidas significam que o cliente ja esta caindo em desconfianca, entao bons sistemas tratam o esforco como razao para sair da automacao mais cedo.

Dois movimentos praticos alem disso:
- Adicione um portao de QA de segundo modelo antes de enviar. A Gorgias envolve cada resposta redigida em uma verificacao separada: "um segundo modelo de IA mede a confianca, e se a resposta nao atingir o limiar, ela nao e enviada." Esta e a melhor protecao contra a falha de alucinar-em-vez-de-escalonar.
- Use limiares mais altos para intencoes de alto risco. O Social Intents sugere escalonar quando a confianca cai abaixo do limiar duas vezes seguidas, com reembolsos, cobranca e cancelamentos sujeitos a um criterio mais rigoroso do que perguntas de baixo risco.
Se voce quiser se aprofundar no ajuste do numero em si, escrevemos um artigo completo sobre definir limiares de confianca para respostas de IA. A versao curta: um limiar e um ponto de partida que voce reajusta, nao uma constante que voce define uma vez.
Esta e tambem a objecao mais comum que ouvimos dos compradores, e e um bom instinto. Um lider de CX em uma marca de suplementos DTC no Gorgias, processando cerca de 7.000 tickets por mes, nos disse exatamente por que:
"A IA nunca vai conseguir responder 100% das perguntas, mas se ela tentar e apenas responder 'desculpe, nao sei isso', nao consigo verificar todos os meus 7.000 tickets... Preciso de uma IA que so gerencie os tickets nos quais ela esta confiante e todos os outros, deixe-os em paz."
Esse "deixe-os em paz" e todo o briefing de design para roteamento por confianca. O trabalho do agente nao e tentar tudo, e possuir com seguranca um segmento e rotear o resto limpa mente.
Etapa 2: Decida o que a IA jamais pode tocar
Antes de ajustar qualquer gatilho, trace uma linha firme em torno das categorias que sempre vao para um humano. Isso e politica, nao probabilidade, e nao deve ser deixado para uma pontuacao de confianca.
Para a maioria das equipes, a lista de "sempre escalonar" se parece com: disputas legais ou qualquer mencao de acao legal, linguagem de fraude e estorno, perguntas medicas ou de saude, e qualquer coisa que exija um julgamento fora da politica escrita. Disputas de assinatura e cobranca geralmente tambem pertencem aqui. A Gorgias publica uma solida lista padrao de topicos de transferencia que voce pode tomar emprestada como ponto de partida.
Igualmente importante e o inverso: permitir que as equipes excluam tipos especificos de tickets da automacao completamente. Isso surge constantemente em nossas proprias conversas de integracaо, com administradores dizendo coisas como "ha certos tickets que nao quero que passem pela IA." Uma boa configuracao respeita isso. Voce deve ser capaz de limitar a IA a, digamos, WISMO e redefinicoes de senha enquanto mantеm reembolsos e alteracoes de conta apenas para humanos desde o primeiro dia, depois ampliar o escopo a medida que constroi confianca. Essa abordagem de autonomia gradual e fundamental para como pensamos sobre a deflexao de suporte de nivel 1: comece estreito, prove, expanda.
Etapa 3: Torne a transferencia completa, nao um despejo de transcricao
E aqui que a maioria dos sistemas de escalonamento falha silenciosamente. A logica de roteamento funciona, o ticket se move, e entao o humano comeca do zero. Essa reinicializacao fria e o que os clientes experimentam como "a automacao acabou de desperdicar meu tempo", e e a unica coisa em que nosso guia de melhores praticas de transferencia humana passa mais tempo.
Os numeros aqui sao brutais. 73% dos consumidores dizem que ter que repetir informacoes е uma das partes mais frustrantes do suporte, especialmente apos uma transferencia, de acordo com um estudo da PwC citado pela BlueTweak. E enquanto cerca de 70% dos clientes esperam que o agente saiba seu historico no escalonamento, apenas cerca de 34% das equipes diz que suas ferramentas realmente passam esses dados limpa mente. A lacuna entre esses dois numeros е onde a confianca morre.
O profissional que melhor expressou isso е Navdeep Singh Gill, em um longo artigo do LinkedIn sobre a transferencia humano-IA:
"Uma transferencia que perde o contexto nao transfere trabalho. Destroi trabalho... Antes de implantar qualquer agente, pergunte: 'Quando este agente transferir, o cliente tera que se repetir?' Se sim, voce nao construiu uma transferencia. Voce construiu um abandono com etapas extras."
Entao, o que uma transferencia completa realmente carrega? Nao o registro de chat bruto, que sao apenas dados nao estruturados. Um pacote de contexto estruturado. Um lider de suporte no r/AI_Customer_Support listou os quatro artefatos que tornam isso valioso: um resumo gerado por IA anexado ao ticket, o historico completo de chat (nao apenas a ultima mensagem), uma indicacao de sentimento se o cliente estiver frustrado, e uma etiqueta clara de motivo-de-escalonamento para que o humano saiba se esta resolvendo o problema ou apenas redefinindo expectativas.

Alguns detalhes que fazem uma grande diferenca:
- Reconheca o trabalho do bot na primeira linha do humano. "Ola Jane, vejo que voce estava conversando com nosso bot sobre como redefinir sua senha, deixe-me ajudar com isso" е melhor do que um generico "Como posso ajudar?" que sinaliza um novo começo.
- Marque cada ticket escalonado para roteamento. Uma etiqueta consistente (a Gorgias usa
ai_handover) permite que regras subsequentes enviem transferencias para a equipe certa automaticamente, para que ninguem precise triage-las manualmente. Se voce esta no Zendesk, nossa configuracao de transferencia de agente de IA do Zendesk percorre exatamente isso, e voce pode marcar tickets automaticamente para que o roteamento ocorra sem humanos no processo.
O contexto bem feito ate acelera a resolucao: relata-se que humanos que recebem escalonamentos com contexto completo os resolvem significativamente mais rapido do que os que comecam do zero, na ordem de 35 a 45% em uma cifra citada por analistas (direcional, mas a direcao е obvia).
Etapa 4: Informe o cliente sobre o que esta acontecendo
Uma superficie de falha separada do contexto: o cliente nao tem ideia do que esta acontecendo entre a IA e o humano. O silencio durante uma transferencia faz as pessoas se perguntarem se foram esquecidas.
A solucao е barata. Nao mude silenciosamente, diga algo como "Claro, estou conectando voce a um agente humano que pode ajudar", e defina uma expectativa de tempo de espera se houver uma ("voce е o #2 na fila, aproximadamente 1-2 minutos"). O Social Intents enquadra essa tranquilizacao como fazendo muito trabalho por muito pouco esforco. E mantenha a saida visivel o tempo todo, porque 80% das pessoas so usarao um chatbot se souberem que existe uma opcao humana, e 30% mudariam para um concorrente apos uma unica ma experiencia com um bot.
Mais uma regra do mesmo playbook: roteie para a equipe certa na primeira vez. A pior versao de uma transferencia е chegar a um humano que imediatamente diz "desculpe, preciso transferi-lo para um departamento diferente." O roteamento baseado em intencao em sua ferramenta е o que previne essa segunda transferencia que destroi a confianca, e е mais importante na deflexao de chat ao vivo onde o cliente esta esperando em tempo real. Reunimos mais desses padroes em nossos exemplos de design de conversa para fluxos de transferencia de IA, e os usuarios do Gorgias podem ajustar o texto em nosso guia para controlar a experiencia de transferencia do agente de IA.
Etapa 5: Meca a transferencia, nao apenas a taxa de deflexao
Se voce medir apenas a taxa de deflexao (ou "contencao"), voce se otimizara para uma armadilha. A versao classica apareceu em um thread do r/sysadmin sobre executar um service desk de IA:
"Uau, gerenciou 5000 problemas este mes! 5000 tickets que nao chegaram a nossa CARA fila humana. Exceto que metade deles criou novo ticket dois dias depois quando a 'resposta' do bot nao resolveu nada, e agora temos um backlog e usuarios mais irritados."
Esse е o problema da deflexao como metrica de vaidade em um paragrafo. Uma alta taxa de deflexao com baixo CSAT е pior do que uma taxa de deflexao menor com clientes felizes. A taxa de transferencia "so se torna significativa quando combinada com resultados", como a BlueTweak coloca.
As metricas que realmente valem a pena acompanhar:
| Metrica | O que ela diz |
|---|---|
| Taxa de escalonamento por intencao | Quais topicos falham na automacao com mais frequencia, para que voce saiba onde adicionar conhecimento |
| Delta de CSAT (automatizado vs escalonado) | Se os chats escalonados pontuam mais baixo, o problema quase sempre е na transferencia, nao no agente |
| Taxa de contato repetido (24 a 48h) | O sinal mais confiavel de falha oculta: uma "resposta" que nao resolveu realmente nada |
| Resolucao no primeiro contato pos-transferencia | Se o humano herdou contexto suficiente para resolver em uma unica vez |
| Tempo-ate-humano apos opt-out | Quanto tempo os clientes esperam apos saírem da IA |
Aprofundamos isso em nossos guias sobre medir a taxa de contencao de IA e a qualidade do escalonamento e a diferenca entre deflexao de IA e deflexao humana. O fio condutor: monitore a qualidade ao lado do volume, ou o numero de volume ira menti-lo. Se voce е novo na metrica em si, comece com o que е a taxa de deflexao e como melhorа-la.

Por fim, crie um habito de revisao mensal: leia uma amostra de tickets marcados e escalonados, procure clusters de transferencia recorrentes (essas sao lacunas de conhecimento) e reajuste. Roteamentos errados sao a entrada para a atualizacao de politica do proximo mes.
Erros comuns de escalonamento a evitar
Um guia rapido de campo para os modos de falha que vemos com mais frequencia, para que voce possa projetar em torno deles desde o inicio:
- Alucinar em vez de escalonar. Sem portao de QA, entao respostas com baixa confianca sao enviadas e o CSAT colapsa silenciosamente.
- O loop "nao entendo". Limite as tentativas com falha a dois ou tres turnos; um loop de nova tentativa interminavel е como os clientes desistem com raiva. O Freshdesk adverte sobre exatamente esses "loops interminaveis frustrantes" em seus documentos de configuracao.
- O buraco negro assincrono. "Escalonado" tecnicamente, depois despejado em uma fila sem acompanhamento. Um postador do r/Anthropic descreveu ter sido informado que "os humanos estao sobrecarregados... entraremos em contato em breve por e-mail" e nunca recebeu resposta. Teatro de escalonamento е pior do que honestidade.
- O loopback. Re-rotear um cliente para o mesmo fluxo automatizado que acabou de falhar com ele. A confianca colapsa rapidamente.
- Sobre-escalonamento. A falha inversa. Quando os pedidos de aprovacao disparam com muita frequencia, as pessoas param de le-los e aprovam tudo reflexivamente, o que frustra o objetivo e se torna sua propria superficie de ataque.
Como gerenciamos escalonamentos na eesel
Construímos a eesel na crenca de que a transferencia е o produto, entao aqui е como as pecas se encaixam (e onde somos adequados versus nao).
Primeiro, voce simula antes de ir ao ar. Esta е a parte de que nunca abriríamos mao. O agente de helpdesk de IA da eesel е executado contra milhares de seus tickets anteriores em uma simulacao, para que voce veja sua taxa de resolucao projetada, sua taxa de escalonamento e exatamente quais conversas teria transferido, antes de um unico cliente ver. Em vez de adivinhar um limiar de confianca e torcer, voce o ajusta contra historico real.

Segundo, o controle е o padrao, nao um upsell. Voce decide quais tipos de tickets a IA toca, define os topicos que sempre vao para um humano e concede autonomia gradualmente а medida que constroi confianca. Voce pode configurar tudo isso em linguagem natural em vez de um motor de regras.

Terceiro, as transferencias sao completas por design. Como a eesel aprende com seus tickets resolvidos, nao apenas com artigos da central de ajuda, o ticket escalonado carrega o resumo, o historico e uma etiqueta de motivo diretamente para o agente certo. Sem reintroducoes. O fluxo vive dentro do seu helpdesk existente: no Zendesk ele marca e roteia a transferencia automaticamente, e funciona da mesma forma para equipes no Freshdesk ou usando Help Scout.
Vimos isso funcionar em escala real. Uma implantacao da eesel executa um agente Zendesk totalmente automatizado em mais de 100.000 tickets em alemao por mes, o tipo de volume de automacao de tickets que so aguenta se o escalonamento е solido. A Gridwise viu a eesel resolver 73% de suas solicitacoes de nivel 1 no primeiro mes, com resultados chegando durante um teste de 7 dias. O fio comum em cada um desses е nao que a IA respondeu tudo, е que ela conhecia seu espaco e o resto transferia limpa mente.
Um aviso honesto: se voce ainda nao tem um corpo de tickets ou documentos anteriores para a IA aprender, qualquer ferramenta (incluindo a nossa) dependerа mais do escalonamento no inicio enquanto constroi conhecimento. Isso е esperado, e е exatamente por que simular primeiro importa, para que voce entre de olhos abertos em vez de surpreso. Se voce ainda esta avaliando opcoes, nosso resumo dos aplicativos de helpdesk de IA mais baratos e nosso guia sobre IA para automacao de atendimento ao cliente sao boas proximas leituras.
Experimente a eesel para escalonamentos de suporte
Se voce esta configurando IA em sua fila de suporte e quer que os escalonamentos sejam gerenciados corretamente desde o primeiro dia, a eesel foi construida exatamente para isso. Ela aprende com seus tickets historicos, permite simular suas taxas de escalonamento e resolucao antes do lancamento, mantеm voce no controle do que a IA toca e passa transferencias completas e marcadas para seu helpdesk existente para que nenhum cliente precise se repetir.
Voce pode conectar seu helpdesk e executar uma simulacao com seus proprios tickets anteriores em minutos, sem necessidade de cartao de credito. Veja em acao na pagina do agente de helpdesk de IA, ou verifique os precos (baseado em uso, sem taxas por assento).

Perguntas frequentes
O que significa escalonar um ticket de suporte com IA?
Quando um agente de IA deve escalonar para um humano?
Como evito que meu agente de suporte de IA escalone demais ou de menos?
Que informacoes uma IA deve passar para um humano durante um escalonamento?
Posso controlar quais tickets a IA gerencia versus quais ela escalona?
Como meco se meu escalonamento de IA esta funcionando?
O escalonamento de IA funciona com Zendesk, Freshdesk e Gorgias?

Article by
Alicia Kirana Utomo
Kira is a writer at eesel AI with a Computer Science background and over a year of hands-on experience evaluating AI-powered customer service tools. She focuses on breaking down how helpdesk platforms and AI agents actually work so that support teams can make better buying decisions.








