URA que não faz o cliente desistir.
Receptivo de SAC, ouvidoria ou cobrança: a URA da Interaflow entende o que o cliente diz (ou digita), resolve o que é simples ali mesmo e transfere pro agente certo — com a conversa já aberta. Voz com OpenAI Realtime, intents nativas e flow builder visual. Roda no PABX que você já tem.
- 14 dias
- Sem cartão
- Sem 'projeto de integração' pra ver rodando
O que é uma URA inteligente
Uma URA (Unidade de Resposta Audível) é o sistema que atende sua ligação antes do humano — historicamente, aquele menu de "digite 1 para financeiro, digite 2 para técnico". Uma URA inteligente é a mesma função, mas com duas diferenças fundamentais: (1) o cliente fala em linguagem natural em vez de navegar por menu, e (2) o sistema entende a intenção por trás da fala, não só a palavra-chave. Em vez de obrigar o cliente a decorar o caminho, a URA pergunta "em que posso ajudar?" e rotea dali.
O ganho não é só experiência — é operação. Uma URA inteligente bem configurada resolve sozinha as demandas repetitivas (segunda via, status do pedido, horário de atendimento, agendamento) e transborda melhor as que exigem humano: chega ao agente com a intenção já classificada, o contato identificado e a fila certa. O atendente não pergunta "qual seu CPF?" pela sétima vez no dia. Ele entra resolvendo.
URA, IVR e URA conversacional — é tudo a mesma coisa?
Na prática do mercado brasileiro: sim. IVR (Interactive Voice Response) é o termo em inglês, URA é o termo em português, e URA conversacional é só a URA que usa IA pra entender voz em linguagem natural — em oposição à URA tradicional de DTMF ("digite 1"). Você vai ver os três nomes na documentação de fornecedor. Aqui na Interaflow chamamos tudo de "URA" — porque o produto faz os três.
O que muda é a abordagem: URA de DTMF (menu de teclas), URA de voz (cliente fala, sistema entende) ou híbrida (começa em voz, cai em DTMF se não entender). Cada uma tem uma operação que ela serve melhor — ver o bloco de abordagens abaixo.
Abordagens
Três abordagens. Uma URA. Configurável por fluxo.
Cada abordagem resolve um tipo de operação melhor. Você não escolhe uma pra vida toda — a gente configura a que faz sentido por fila, por horário, por tipo de cliente.
Voz (conversacional)
SAC de alto volume. Operação com público não-digital. Quer reduzir labirinto de menu.
- Como funciona
- Cliente fala em linguagem natural; IA classifica intenção e rotea.
- Risco
- Exige ajuste de prompt nas 1ª 2 semanas — intent errado = transbordo errado.
DTMF (clássica)
Operação técnica com vocabulário fixo (cobrança por código, número de contrato).
- Como funciona
- Cliente navega por menu com teclado ("digite 1 para…"). Zero IA.
- Risco
- Cliente desiste em menus longos — manter ≤3 níveis.
Híbrida (voz + DTMF)
Operação que não pode errar (saúde, jurídico) e quer ganho de voz sem risco de transbordo torto.
- Como funciona
- Começa em voz, cai em DTMF se a IA não classifica com confiança.
- Risco
- Flow fica mais complexo — vale a pena se o custo de erro é alto.
Componente técnico por abordagem: voz roda em OpenAI Realtime API; DTMF em PJSIP/chan_sip; híbrida combina os dois via flow builder + logic_split.
Recursos
O que entrega, além de atender em voz
URA só rende quando o restante da cadeia acompanha. Tudo abaixo é nativo, na mesma plataforma, sem licença separada de IA.
Voz em PT-BR com OpenAI Realtime
Agente de voz com streaming bidirecional de áudio via SIP/WebRTC, usando OpenAI Realtime API. Voice Activity Detection (VAD) nativo detecta quando o cliente parou de falar, sem depender de silêncio arbitrário. Modelo é multilíngue — PT-BR é o idioma padrão da tenant brasileira. Audio em tempo real, sem 'barreira' de STT + TTS em duas etapas.
Classificação semântica de intenção
Cada enunciado do cliente passa por intent classification — via heurística local rápida ou via OpenAI pra casos ambíguos. Intent rotulada vira decisão de fluxo: transbordo pra fila X, resposta automática Y, coleta de entidade Z. Prompt gerencial é versionado por campanha e auditável no sandbox de prompts.
Flow builder visual pra fluxo receptivo
Editor drag-and-drop (ReactFlow) com 11+ tipos de nó: start, conversation, function, call_transfer, agent_transfer, press_digit (DTMF), logic_split, extract_variable, mcp, ending. Fluxo receptivo (IVR) tem componente dedicado com node map específico. Versionamento de fluxos com rollback — nenhum deploy acidental vira problema de madrugada.
Transbordo por skill, horário e intenção
Transferência via call_transfer (pra tronco/fila externa) ou agent_transfer (pra agente interno). Regras encadeiam skill do agente + horário da operação + intenção classificada + prioridade de fila. Interceptores globais (catch-all) garantem que palavras como 'agente', 'atendente' ou 'cancelar' sejam capturadas em qualquer ponto do fluxo — cliente nunca fica preso no menu.
Extração de entidades ao vivo
NER nativo captura CPF, número do pedido, data, valor, telefone alternativo durante a chamada. Quando transborda pro humano, o agente já recebe a ficha preenchida. Quando resolve sozinho, os dados vão pro CRM via outbox pattern — chamada de API com retry e DLQ, sem perder evento.
A/B de roteiros e prompts
Comparação A/B nativa de scripts e prompts: duas versões rodando em paralelo, métrica de contenção, tempo de resolução, taxa de transbordo por intenção. Versionamento de fluxo permite rollback instantâneo se a nova variação piorar.
Matriz de decisão
Que URA cabe no seu receptivo?
Três recortes que cobrem a maioria dos casos. Se a sua operação não está aqui, tem um quarto recorte no CTA no fim da página.
SAC de alto volume, público amplo
Voz como padrão, DTMF como fallback.
Alto volume (>3 mil chamadas/dia) e público heterogêneo tendem a responder melhor à voz — reduz abandono em menu longo, resolve intenções repetitivas sem humano. Intenção "falar com atendente" dispara transbordo imediato (interceptor global). Ajuste de prompt nas primeiras 2 semanas é obrigatório — intent errado derruba contenção.Operação técnica com vocabulário fixo
DTMF puro, com saída em voz pra catch-all.
Cobrança por código, menu de seleção de contrato, URA de operadora de saúde: vocabulário fechado, risco de erro de IA alto demais pra justificar voz como primária. Mantém DTMF, mas adiciona intercept "quero falar com alguém" em voz pra não prender o cliente.Operação regulada (saúde, jurídico, financeiro)
Híbrida, com fallback pra humano quando confiança < 70%.
Regulação ou contrato exige zero tolerância a classificação errada. Voz resolve o que for óbvio ("agendamento", "segunda via"), DTMF serve pra dados sensíveis (CPF por teclado em vez de voz), e qualquer intent com confidence baixa cai direto pra humano — sem "re-perguntar". Dá pra rodar em campanhas receptivas coordenadas com CRM e fluxos de cobrança.
FAQ
Perguntas que a gente ouve toda semana
Roda uma URA real. Mede contenção. Decide.
Aponta uma DID de teste pra Interaflow, configura o flow receptivo em 15 minutos, deixa rodar por 72 horas. Olha o dashboard: taxa de contenção, intenções detectadas, tempo de auto-atendimento, transbordo por fila. Se o número não fechar, a gente ajusta o prompt junto — ou você sai.
14 dias. Sem cartão. Sem trocar seu PABX pra ver rodando.