Ciência de dados na linha de comando
Você conhece a dBooks ? É uma plataforma de e-books que disponibiliza centenas de livros que são licenciados pela Creative Commons License (CC BY-SA).
Isso significa que você pode baixar gratuitamente qualquer um dos livros sobre essa licença !
O livro de hoje é o Data Science at the Command Line
Este guia completamente revisado demonstra como a flexibilidade da linha de comando pode ajudá-lo a se tornar um cientista de dados mais eficiente e produtivo. Você aprenderá a combinar ferramentas de linha de comando pequenas, porém poderosas, para obter, depurar, explorar e modelar rapidamente seus dados. Para começar, o autor Jeroen Janssens fornece uma imagem do Docker com mais de 100 ferramentas poderosas Unix – úteis se você trabalha com Windows, macOS ou Linux. Você descobrirá rapidamente por que a linha de comando é uma tecnologia ágil, escalável e extensível . Mesmo que você se sinta à vontade para processar dados com Python ou R, aprenderá como melhorar muito seu fluxo de trabalho de ciência de dados aproveitando o poder da linha de comando. Este livro é ideal para cientistas de dados, analistas, engenheiros, administradores de sistemas e pesquisadores.
- Obter dados de sites, APIs, bancos de dados e planilhas;
- Executar operações de limpeza em arquivos de texto, CSV, HTML, XML e JSON;
- Explorar dados, calcular estatísticas descritivas e criar visualizações;
- Gerencie seu fluxo de trabalho de ciência de dados;
- Crie suas próprias ferramentas a partir de one-liners e código Python ou R existente;
- Paralelizar e distribuir pipelines com uso intensivo de dados;
- Modelar dados com algoritmos de redução de dimensionalidade, regressão e classificação;
- Aproveite a linha de comando do Python, Jupyter, R, RStudio e Apache Spark.
Para efetuar o download do livro, CLIQUE AQUI !
Essa foi uma dica do Luciano Almeida