Compactação de prompt e otimização de consulta | CURSO GRATUITO

A DeepLearning.AI está oferecendo GRATUITAMENTE o curso Prompt Compression and Query Optimization.

Sobre o curso

Este curso se concentra na integração de recursos de banco de dados tradicionais com recursos de pesquisa vetorial para otimizar o desempenho e a economia de aplicativos de geração aumentada de recuperação (RAG) em grande escala.

Você aprenderá como aplicar estas técnicas principais:

Pré-filtragem e pós-filtragem: são técnicas para filtrar resultados com base em condições específicas. A pré-filtragem é feita na fase de criação do índice do banco de dados, enquanto a pós-filtragem é aplicada após a realização da pesquisa vetorial.
Projeção: Esta técnica envolve a seleção de um subconjunto de campos retornados de uma consulta para minimizar o tamanho da saída.
Reclassificação: envolve reordenar os resultados de uma pesquisa com base em outros campos de dados para mover os resultados mais desejados para o topo da lista.
Compactação de prompts: esta técnica é usada para reduzir o comprimento dos prompts, cujo processamento pode ser caro em aplicativos de grande escala.

Você também aprenderá com exercícios práticos como:

Implemente a pesquisa vetorial para RAG usando MongoDB.
Desenvolva um pipeline de agregação MongoDB de vários estágios.
Use metadados para refinar e limitar os resultados de pesquisa retornados das operações do banco de dados, aumentando a eficiência e a relevância.
Simplifique os resultados das operações de banco de dados incorporando um estágio de projeção no pipeline de agregação do MongoDB, reduzindo a quantidade de dados retornados e otimizando o desempenho, o uso de memória e a segurança.
Reclassifique documentos para melhorar a relevância e a qualidade da recuperação de informações e use valores de metadados para determinar a posição de reordenação.
Implemente a compactação imediata e tenha uma ideia de como usá-la e das vantagens operacionais que ela traz para aplicativos LLM.

Comece a otimizar a eficiência, a segurança, a velocidade de processamento de consultas e o custo de seus aplicativos RAG com compactação imediata e técnicas de otimização de consultas.

CLIQUE AQUI para começar os seus estudos !

Compactação de prompt e otimização de consulta

Compactação de prompt e otimização de consulta | CURSO GRATUITO

Equipe GPO

Prestigie o autor e deixe o seu comentário: Cancelar resposta