# Geração de Recuperação Aumentada
> [!NOTE] Geração de Recuperação Aumentada
> **Retrieval-Augmented Generation (RAG)**, ou Geração Aumentada por Recuperação, é uma técnica que combina a capacidade de geração de texto de [[Grandes Modelos de Linguagem]] (LLMs) com a capacidade de recuperação de informações de fontes externas.
>
> O objetivo principal do RAG é fornecer aos LLMs informações relevantes e atualizadas para melhorar a precisão, relevância e factualidade de suas respostas, reduzindo as "alucinações" (quando o [[Grandes modelos de linguagem|LLM]] inventa fatos) e permitindo que ele acesse conhecimentos específicos que não estavam em seus dados de treinamento originais.
O RAG consiste em três componentes principais:
1. **Retrieval (Recuperação):** Envolve a busca de informações relevantes em documentos para responder a uma pergunta. O sistema busca documentos relevantes na base de conhecimento.
2. **Augmentation (Aumento):** Refere-se à melhoria das capacidades do modelo, inserindo informações encontradas como contexto no _prompt_ do usuário.
3. **Generation (Geração):** Refere-se à capacidade natural das LLMs de gerar um texto coerente.
**:: Referência ::** [[7 AI Terms You Need to Know Agents, RAG, ASI & More]]
**:: Referência ::** [LangChain: criando chatbots inteligentes com RAG: Aula 1 - Atividade 3 Estrutura do curso | Alura - Cursos online de tecnologia](https://cursos.alura.com.br/course/langchain-criando-chatbots-inteligentes-rag/task/203576?b2cUser=true)
# Notas