FAQ
Planos e limites
Não há autoatendimento de plano hoje. Limites operacionais são acordados na contratação. Limites técnicos relevantes (capacidade de Atendente, RPM de API, retenção) ficam expostos por tenant.
Atualizado em
Posicionamento
A estrutura comercial de planos do Interaflow é tratada na contratação, não exposta como autoatendimento na UI. Esta página cobre os limites operacionais que existem hoje — o que cada tenant consegue inferir dos próprios números — e marca onde a informação comercial específica precisa vir do time Interaflow.
Limites operacionais visíveis no produto
Capacidade de Atendente
Cada Atendente tem capacidade configurável dentro do tenant:
- Capacidade simultânea de chats — padrão 3 por
Atendente. Configurável no perfil do Atendente, ajuste por Fila
via
max_concurrent_per_agent. - Capacidade simultânea de voz — padrão 1 por Atendente. Voz tipicamente é 1:1; valores acima são incomuns.
- Override temporário — supervisor pode conceder mais slots por janela definida; sistema reverte ao default automaticamente.
Esses limites são parte do desenho operacional, não comerciais — ajuste conforme a complexidade do atendimento.
Rate limit de API
Cada chave de API tem limite
de chamadas por minuto (rate_limit_rpm):
- Padrão global do tenant quando não definido na chave.
- Override por chave quando uma integração específica precisa de mais (ou menos).
- Excesso resulta em 429 Too Many Requests com
Retry-After.
O valor do padrão global é parte da configuração comercial do tenant — confirme com o time Interaflow.
Capacidade de voz (telefonia)
A capacidade real de chamadas simultâneas depende de:
- Limite por tronco SIP (
max_channels_trunk, padrão 30 mas ajustado conforme o que a operadora contratou). - CAP Pool quando troncos compartilham capacidade agregada (ver Troncos SIP).
- CPS (calls per second) imposto pela operadora ao CNPJ do Contratante.
Acompanhe em tempo real pelo Monitor de Tráfego.
Armazenamento
- Banco principal — Conversas, mensagens, configurações. Cresce com volume de operação.
- Storage de objeto — gravações
.wav, documentos de Conhecimento, Materiais, uploads. - Embeddings (RAG) — vetores derivados de Conhecimento.
- Política de retenção definida no nível de infraestrutura do tenant (ver Gravações).
Limites de armazenamento por plano não estão expostos self-service.
Documentos de Conhecimento
- Tipos suportados: PDF, MD, TXT, HTML, URL.
- Indexação assíncrona após upload — sem fila visível, mas o
status do documento (
pendente → indexando → pronto) é rastreado por documento. - Limite de tamanho por documento e quota de bases por tenant são parte da contratação.
Materiais
- Limite de 100 MB por arquivo (visível na UI).
- Limite total da biblioteca por Operação não está exposto self-service.
Fluxos e Campanhas
Não há limite “por plano” exposto na UI para número de Fluxos, Campanhas, Operações ou Filas que o tenant pode ter. Os limites práticos são por performance (tenant com 10.000 Campanhas ativas terá experiência diferente de tenant com 50) e por custo de IA (mais Fluxos rodando = mais tokens consumidos).
Tier de Guardrails
Cada Operação tem um tier de Guardrails (basico, pro,
enterprise) que controla quais engines de validação estão
disponíveis:
- Básico — engines locais (static, keyword, heuristic, embedding).
- Pro — adiciona LLM-as-judge e modelos dedicados.
- Enterprise — adiciona integrações externas.
O tier é configurado por Operação. Habilitação para tier maior envolve contratação. Detalhes em Guardrails.
Custo de IA (OpenAI)
A IA do Interaflow consome a chave OpenAI do tenant (guia). Os custos batem direto na conta OpenAI, não no Interaflow:
- Realtime API (voz) — proporcional a minutos de conversa.
- Chat (gpt-4o, gpt-4o-mini) — proporcional a tokens (input + output).
- Embeddings — pequeno, uma vez por documento.
- Whisper — proporcional a duração da gravação avaliada por Qualidade.
Como ajustar custo:
- Reduzir
sample_rateem Formulários de Qualidade. - Trocar
gpt-4oporgpt-4o-minino chat onde aplicável. - Limpar Bases de Conhecimento ruidosas (chunks menores, recuperação melhor).
- Desligar
recording_modeem Campanhas que não precisam de Qualidade.
Como medir o que estou usando
| Indicador | Onde olhar |
|---|---|
| Conversas atendidas no período | Histórico Consolidado |
| Mensagens trocadas | Histórico Detalhado |
| Chamadas discadas | Relatório de Chamadas |
| Capacidade de voz em uso agora | Monitor de Tráfego |
| Última atividade de chave de API | Chaves de API (last_used_at) |
| Custo OpenAI | Dashboard da OpenAI — fora do Interaflow |
| Storage | Solicitar ao time Interaflow (sem painel self-service) |
O que ainda não está visível na UI
- Painel de uso e gasto consolidado por tenant.
- Tabela de planos com inclusões e limites comerciais.
- Alertas automáticos ao se aproximar de limite.
- Atualização self-service de plano.
Boas práticas
- Revise capacidade de Atendente após primeiras semanas. O default de 3 chats simultâneos cobre a maioria, mas pode ser baixo demais em FAQ leve ou alto demais em atendimento consultivo.
- Acompanhe o Monitor de Tráfego durante operações outbound de pico — saturação de tronco é a forma mais comum de “limite” visível.
- Combine
sample_rateerecording_modepara controlar custo de Qualidade + storage de gravação. - Audite chaves de API sem uso há 30 dias — provavelmente são candidatas a desativar.
Erros comuns
- Esperar limite explícito de “X Conversas/mês”. Hoje a unidade técnica é “Conversa atendida”; o que vira limite comercial depende do contrato.
- Confundir capacidade de tronco com capacidade do plano. São coisas distintas — tronco é contrato com a operadora; plano é contrato com a Interaflow.
- Tentar mudar plano pela UI. Não dá; é via comercial.
- Esperar painel de custo OpenAI dentro do Interaflow. Custo é da conta OpenAI do tenant; veja no dashboard da OpenAI.