Compactação de prompt e otimização de consulta | CURSO GRATUITO
A DeepLearning.AI está oferecendo GRATUITAMENTE o curso Prompt Compression and Query Optimization.
Sobre o curso
Este curso se concentra na integração de recursos de banco de dados tradicionais com recursos de pesquisa vetorial para otimizar o desempenho e a economia de aplicativos de geração aumentada de recuperação (RAG) em grande escala.
Você aprenderá como aplicar estas técnicas principais:
- Pré-filtragem e pós-filtragem: são técnicas para filtrar resultados com base em condições específicas. A pré-filtragem é feita na fase de criação do índice do banco de dados, enquanto a pós-filtragem é aplicada após a realização da pesquisa vetorial.
- Projeção: Esta técnica envolve a seleção de um subconjunto de campos retornados de uma consulta para minimizar o tamanho da saída.
- Reclassificação: envolve reordenar os resultados de uma pesquisa com base em outros campos de dados para mover os resultados mais desejados para o topo da lista.
- Compactação de prompts: esta técnica é usada para reduzir o comprimento dos prompts, cujo processamento pode ser caro em aplicativos de grande escala.
Você também aprenderá com exercícios práticos como:
- Implemente a pesquisa vetorial para RAG usando MongoDB.
- Desenvolva um pipeline de agregação MongoDB de vários estágios.
- Use metadados para refinar e limitar os resultados de pesquisa retornados das operações do banco de dados, aumentando a eficiência e a relevância.
- Simplifique os resultados das operações de banco de dados incorporando um estágio de projeção no pipeline de agregação do MongoDB, reduzindo a quantidade de dados retornados e otimizando o desempenho, o uso de memória e a segurança.
- Reclassifique documentos para melhorar a relevância e a qualidade da recuperação de informações e use valores de metadados para determinar a posição de reordenação.
- Implemente a compactação imediata e tenha uma ideia de como usá-la e das vantagens operacionais que ela traz para aplicativos LLM.
Comece a otimizar a eficiência, a segurança, a velocidade de processamento de consultas e o custo de seus aplicativos RAG com compactação imediata e técnicas de otimização de consultas.