Qualidade de dados em ETL com Pandera e Python: Um Guia para Contrato de Dados | EVENTO GRATUITO
Sobre o evento
Neste workshop intensivo e informativo, teremos a oportunidade de mergulhar no universo da gestão de dados utilizando a linguagem de programação Python. Iremos demonstrar, de maneira detalhada e prática, como aplicar e criar um contrato de dados por meio da biblioteca Pandera, uma ferramenta poderosa que permite a validação e a verificação de estruturas de dados de forma eficiente.
Durante o workshop, apresentaremos um fluxo de trabalho ETL (Extração, Transformação e Carregamento) completo e robusto. Inicialmente, iremos extrair dados diretamente de uma planilha Excel, um formato amplamente utilizado no meio corporativo para o armazenamento e compartilhamento de informações. Com o uso de técnicas e códigos específicos, mostraremos como é possível ler e manipular esses dados com precisão.
Após a extração bem-sucedida, passaremos ao processo de transformação dos dados, onde aplicaremos os contratos de dados para garantir que as informações que estamos manipulando estejam íntegras e confiáveis. Aqui, a biblioteca Pandera entra em cena como uma ferramenta essencial, pois irá nos ajudar a definir esquemas de dados que assegurem que todos os requisitos e regras estão sendo cumpridos antes de prosseguirmos para a próxima etapa. Por fim, abordaremos o carregamento dos dados validados para um banco de dados PostgreSQL, uma plataforma de gerenciamento de banco de dados de código aberto e uma das mais populares do mercado.
Demonstraremos como estabelecer uma conexão segura com o banco de dados e como realizar o salvamento de dados de forma eficaz, garantindo que o fluxo de informação seja mantido sem erros ou perdas. Ao longo do workshop, enfatizaremos a importância de garantir a qualidade dos dados com os quais trabalhamos. Sabemos que dados de má qualidade podem levar a decisões empresariais equivocadas e prejudicar o desempenho dos sistemas. Por isso, ensinaremos como implementar contratos de dados de maneira eficiente e prática, o que irá contribuir significativamente para a confiabilidade e o sucesso dos seus projetos de análise de dados.
Prepare-se para elevar suas habilidades em Python e gestão de dados a um novo patamar, participando deste workshop interativo e cheio de aprendizado aplicável. Não perca a chance de se tornar um profissional ainda mais qualificado na área de ciência de dados.
Quando: 13 de Junho 2024
Horário: 20:00 BRT
Idioma: Português