Use keyword quando…
Quer o documento específico. Sabe o número do contrato, nome do projeto, SKU. Busca exata é mais rápida e mais barata.
Você não busca "manual_v3_final_USAR_ESTE.pdf" — você pergunta "como faço para abrir uma exceção de crédito acima de 500k?". A busca tradicional não responde isso. RAG (Retrieval-Augmented Generation) responde, e ainda mostra de onde tirou.
Não é "novo é melhor que velho". É reconhecer que palavra-chave e busca semântica resolvem problemas diferentes — e empresas precisam dos dois.
| Busca tradicional (keyword) | RAG (busca semântica + LLM) | |
|---|---|---|
| Entrada | Palavras exatas; operadores booleanos. | Pergunta em linguagem natural. |
| O que recupera | Documentos cujo texto contém as palavras. | Trechos com intenção semelhante, mesmo sem palavras iguais. |
| O que devolve | Lista de links. | Resposta sintetizada citando fonte original. |
| Forças | Rápido. Determinístico. Bom para nomes próprios e códigos. | Lida com sinônimos, paráfrases, intenções implícitas. |
| Fraquezas | Não entende "como faço" sem você saber o termo. | Pode alucinar se mal calibrado; precisa de citação obrigatória. |
| Caso ideal | "Achar o contrato 2024-1182". | "Quais nossas regras para férias coletivas?". |
Cinco etapas que acontecem em milissegundos. Entender o que cada uma faz ajuda a avaliar fornecedores — e identificar quem está vendendo "RAG" sem ter RAG.
Documentos são quebrados em pedaços de ~500-1000 tokens com sobreposição.
Cada chunk vira um vetor de 1536 dimensões via modelo de embedding.
Vetores guardados em pgvector com índice HNSW para busca rápida.
Pergunta também vira vetor. K-NN traz os trechos mais próximos por cosseno.
LLM sintetiza usando apenas os trechos recuperados. Citação obrigatória.
Sem citação obrigatória, RAG vira chatbot bonitinho que inventa. A regra é dura: se a LLM não consegue apontar o trecho da fonte que sustenta a frase, a frase não pode aparecer na resposta.
Três técnicas que separam um RAG sério de um RAG de demo:
"A pergunta certa não é 'sua IA acerta?'. É 'sua IA sabe quando não sabe?'"
A boa busca corporativa moderna combina os dois. Cada modo tem um caso ideal — e o sistema decide qual rodar com base na pergunta.
Quer o documento específico. Sabe o número do contrato, nome do projeto, SKU. Busca exata é mais rápida e mais barata.
Tem uma dúvida, não um arquivo em mente. "Como faço…", "Quais nossas regras para…", "O que decidimos sobre…".
Pergunta tem termos técnicos + intenção. Sistema roda os dois em paralelo e consolida via re-ranking. É o padrão do Corptex.
Mostramos perguntas reais com citação, score de confiança e handoff para especialista quando a base não responde com segurança.