Manual de Java Web Scraping
Você conhece a dBooks ? É uma plataforma de e-books que disponibiliza centenas de livros que são licenciados pela Creative Commons License (CC BY-SA).
Isso significa que você pode baixar gratuitamente qualquer um dos livros sobre essa licença !
O livro de hoje é o Java Web Scraping Handbook
O rastreamento da Web é a arte de buscar dados de um site de terceiros baixando e analisando o código HTML para extrair os dados desejados. Pode ser difícil. De código HTML ruim ao uso pesado de Javascript e técnicas anti-bot, muitas vezes é complicado. Muitas empresas o utilizam para obter conhecimento sobre preços de concorrentes, agregação de notícias, coleta de e-mail em massa.
Este livro vai te ensinar como extrair dados de qualquer site, como lidar com sites pesados AJAX/Javascript, quebrar captchas, implantar seus scrapers na nuvem e muitas outras técnicas avançadas.
Para efetuar o download do livro, CLIQUE AQUI !