Pular para o conteúdo

Compactação de prompt e otimização de consulta

Compactação de prompt e otimização de consulta | CURSO GRATUITO

DeepLearning.AI está oferecendo GRATUITAMENTE o curso Prompt Compression and Query Optimization.

Sobre o curso

Este curso se concentra na integração de recursos de banco de dados tradicionais com recursos de pesquisa vetorial para otimizar o desempenho e a economia de aplicativos de geração aumentada de recuperação (RAG) em grande escala.

Você aprenderá como aplicar estas técnicas principais:

  • Pré-filtragem e pós-filtragem: são técnicas para filtrar resultados com base em condições específicas. A pré-filtragem é feita na fase de criação do índice do banco de dados, enquanto a pós-filtragem é aplicada após a realização da pesquisa vetorial.
  • Projeção: Esta técnica envolve a seleção de um subconjunto de campos retornados de uma consulta para minimizar o tamanho da saída.
  • Reclassificação: envolve reordenar os resultados de uma pesquisa com base em outros campos de dados para mover os resultados mais desejados para o topo da lista.
  • Compactação de prompts: esta técnica é usada para reduzir o comprimento dos prompts, cujo processamento pode ser caro em aplicativos de grande escala.

Você também aprenderá com exercícios práticos como:

  • Implemente a pesquisa vetorial para RAG usando MongoDB.
  • Desenvolva um pipeline de agregação MongoDB de vários estágios.
  • Use metadados para refinar e limitar os resultados de pesquisa retornados das operações do banco de dados, aumentando a eficiência e a relevância.
  • Simplifique os resultados das operações de banco de dados incorporando um estágio de projeção no pipeline de agregação do MongoDB, reduzindo a quantidade de dados retornados e otimizando o desempenho, o uso de memória e a segurança.
  • Reclassifique documentos para melhorar a relevância e a qualidade da recuperação de informações e use valores de metadados para determinar a posição de reordenação.
  • Implemente a compactação imediata e tenha uma ideia de como usá-la e das vantagens operacionais que ela traz para aplicativos LLM.

Comece a otimizar a eficiência, a segurança, a velocidade de processamento de consultas e o custo de seus aplicativos RAG com compactação imediata e técnicas de otimização de consultas.

Equipe GPO

Equipe GPO

Equipe GPO (Grupo de Profissionais Oracle)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

plugins premium WordPress