RAG Que Funciona: Como Re-Ranking e Chunking Semântico Reduziram Minhas Alucinações em 86%
Eu tinha um problema: meu chatbot IA respondia perguntas sobre meus próprios documentos com a confiança de um político, mas com a precisão de um meteorologista. “Sim, isso está no documento” — dizia. Não estava. O culpado? Um pipeline RAG (Retrieval-Augmented Generation) preguiçoso que jogava documentos inteiros no prompt e torcia. Funcionava pra perguntas simples….
