FAQ

Planos e limites

Não há autoatendimento de plano hoje. Limites operacionais são acordados na contratação. Limites técnicos relevantes (capacidade de Atendente, RPM de API, retenção) ficam expostos por tenant.

Atualizado em 04 de maio de 2026

Posicionamento

A estrutura comercial de planos do Interaflow é tratada na contratação, não exposta como autoatendimento na UI. Esta página cobre os limites operacionais que existem hoje — o que cada tenant consegue inferir dos próprios números — e marca onde a informação comercial específica precisa vir do time Interaflow.

Limites operacionais visíveis no produto

Capacidade de Atendente

Cada Atendente tem capacidade configurável dentro do tenant:

Capacidade simultânea de chats — padrão 3 por Atendente. Configurável no perfil do Atendente, ajuste por Fila via max_concurrent_per_agent.
Capacidade simultânea de voz — padrão 1 por Atendente. Voz tipicamente é 1:1; valores acima são incomuns.
Override temporário — supervisor pode conceder mais slots por janela definida; sistema reverte ao default automaticamente.

Esses limites são parte do desenho operacional, não comerciais — ajuste conforme a complexidade do atendimento.

Rate limit de API

Cada chave de API tem limite de chamadas por minuto (rate_limit_rpm):

Padrão global do tenant quando não definido na chave.
Override por chave quando uma integração específica precisa de mais (ou menos).
Excesso resulta em 429 Too Many Requests com Retry-After.

O valor do padrão global é parte da configuração comercial do tenant — confirme com o time Interaflow.

Capacidade de voz (telefonia)

A capacidade real de chamadas simultâneas depende de:

Limite por tronco SIP (max_channels_trunk, padrão 30 mas ajustado conforme o que a operadora contratou).
CAP Pool quando troncos compartilham capacidade agregada (ver Troncos SIP).
CPS (calls per second) imposto pela operadora ao CNPJ do Contratante.

Acompanhe em tempo real pelo Monitor de Tráfego.

Armazenamento

Banco principal — Conversas, mensagens, configurações. Cresce com volume de operação.
Storage de objeto — gravações .wav, documentos de Conhecimento, Materiais, uploads.
Embeddings (RAG) — vetores derivados de Conhecimento.
Política de retenção definida no nível de infraestrutura do tenant (ver Gravações).

Limites de armazenamento por plano não estão expostos self-service.

Documentos de Conhecimento

Tipos suportados: PDF, MD, TXT, HTML, URL.
Indexação assíncrona após upload — sem fila visível, mas o status do documento (pendente → indexando → pronto) é rastreado por documento.
Limite de tamanho por documento e quota de bases por tenant são parte da contratação.

Materiais

Limite de 100 MB por arquivo (visível na UI).
Limite total da biblioteca por Operação não está exposto self-service.

Fluxos e Campanhas

Não há limite “por plano” exposto na UI para número de Fluxos, Campanhas, Operações ou Filas que o tenant pode ter. Os limites práticos são por performance (tenant com 10.000 Campanhas ativas terá experiência diferente de tenant com 50) e por custo de IA (mais Fluxos rodando = mais tokens consumidos).

Tier de Guardrails

Cada Operação tem um tier de Guardrails (basico, pro, enterprise) que controla quais engines de validação estão disponíveis:

Básico — engines locais (static, keyword, heuristic, embedding).
Pro — adiciona LLM-as-judge e modelos dedicados.
Enterprise — adiciona integrações externas.

O tier é configurado por Operação. Habilitação para tier maior envolve contratação. Detalhes em Guardrails.

Custo de IA (OpenAI)

A IA do Interaflow consome a chave OpenAI do tenant (guia). Os custos batem direto na conta OpenAI, não no Interaflow:

Realtime API (voz) — proporcional a minutos de conversa.
Chat (gpt-4o, gpt-4o-mini) — proporcional a tokens (input + output).
Embeddings — pequeno, uma vez por documento.
Whisper — proporcional a duração da gravação avaliada por Qualidade.

Como ajustar custo:

Reduzir sample_rate em Formulários de Qualidade.
Trocar gpt-4o por gpt-4o-mini no chat onde aplicável.
Limpar Bases de Conhecimento ruidosas (chunks menores, recuperação melhor).
Desligar recording_mode em Campanhas que não precisam de Qualidade.

Como medir o que estou usando

Indicador	Onde olhar
Conversas atendidas no período	Histórico Consolidado
Mensagens trocadas	Histórico Detalhado
Chamadas discadas	Relatório de Chamadas
Capacidade de voz em uso agora	Monitor de Tráfego
Última atividade de chave de API	Chaves de API (`last_used_at`)
Custo OpenAI	Dashboard da OpenAI — fora do Interaflow
Storage	Solicitar ao time Interaflow (sem painel self-service)

O que ainda não está visível na UI

Painel de uso e gasto consolidado por tenant.
Tabela de planos com inclusões e limites comerciais.
Alertas automáticos ao se aproximar de limite.
Atualização self-service de plano.

Boas práticas

Revise capacidade de Atendente após primeiras semanas. O default de 3 chats simultâneos cobre a maioria, mas pode ser baixo demais em FAQ leve ou alto demais em atendimento consultivo.
Acompanhe o Monitor de Tráfego durante operações outbound de pico — saturação de tronco é a forma mais comum de “limite” visível.
Combine sample_rate e recording_mode para controlar custo de Qualidade + storage de gravação.
Audite chaves de API sem uso há 30 dias — provavelmente são candidatas a desativar.

Erros comuns

Esperar limite explícito de “X Conversas/mês”. Hoje a unidade técnica é “Conversa atendida”; o que vira limite comercial depende do contrato.
Confundir capacidade de tronco com capacidade do plano. São coisas distintas — tronco é contrato com a operadora; plano é contrato com a Interaflow.
Tentar mudar plano pela UI. Não dá; é via comercial.
Esperar painel de custo OpenAI dentro do Interaflow. Custo é da conta OpenAI do tenant; veja no dashboard da OpenAI.