Pular para o conteúdo

Pipeline ETL Python – Converter PDFs em dados estruturados: Pandas, Camelot, PDFminer, Github e SQL

Pipeline ETL Python – PDFs to SQL | CURSO GRATUITO

O canal do Luciano Galvão Filho está disponibilizando GRATUITAMENTE o curso Pipeline ETL Python – PDFs to SQL.

Sobre o curso

Você é meu convidado para construir uma ETL do zero, capaz de transformar PDFs em dados estruturados, usando Python e ferramentas Open Source.

O que é uma ETL?

ETL significa Extract, Transform, Load (Extrair, Transformar, Carregar). É um processo utilizado para extrair dados de várias fontes, transformá-los em um formato adequado e carregá-los em um banco de dados ou data warehouse.

O que você vai aprender?

  • Converter PDFs em dados estruturados: Automatize a leitura e interpretação de dados contidos em PDFs.
  • Exportar diretamente para SQL: Transforme os dados extraídos em tabelas SQL prontas para análise.
  • Criar uma ETL do zero usando Python: Aprenda a construir todo o processo de ETL utilizando Python, Git e boas práticas de projetos de dados.

Essa foi uma dica do Alexandre Dellote

Equipe GPO

Equipe GPO

Equipe GPO (Grupo de Profissionais Oracle)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

plugins premium WordPress