Data Science: Regressão Linear | CURSO GRATUITO
A universidade de Harvard está oferecendo o curso Data Science: Linear Regression através da eDX.
Sobre o curso
A regressão linear é comumente usada para quantificar a relação entre duas ou mais variáveis. Também é usado para ajustar a confusão. Este curso, parte do nosso Programa de Certificação Profissional em Ciência de Dados, aborda como implementar a regressão linear e ajustar a confusão na prática usando R.
Em aplicações de ciência de dados, é muito comum o interesse na relação entre duas ou mais variáveis. O estudo de caso motivador que examinamos neste curso está relacionado à abordagem baseada em dados usada para construir times de beisebol descrita em Moneyball. Tentaremos determinar quais resultados medidos melhor prevêem as corridas de beisebol usando regressão linear.
Também examinaremos a confusão, onde variáveis estranhas afetam a relação entre duas ou mais variáveis, levando a associações espúrias. A regressão linear é uma técnica poderosa para remover fatores de confusão, mas não é um processo mágico. É essencial entender quando é apropriado usar, e este curso ensinará quando aplicar esta técnica.
O que você aprenderá
- Como a regressão linear foi originalmente desenvolvida por Galton
- O que é confuso e como detectá-lo
- Como examinar as relações entre variáveis implementando a regressão linear em R
Essa foi uma dica da Marta Genova