Regresión Lineal – Variables Dummy

Las regresiones lineales multivariables, consisten en una variable dependiente y varias independientes. Por ejemplo:

regresion lineal python machine learning

En este caso, x1, x2, x3, representan valores numéricos de la tabla pero D4 es una representación de la columna State que es Categórico. Para procesarlo, se genera una columna New York Dummy booleana que guarda 1 si es NY y 0 si es California.

NO hace falta hacer una columna por cada estado en este caso. Generalizando, se deben hacer n-1 columnas donde n es la cantidad de valores diferentes que puede tomar la variable categórica. Si se incluyen todas, no se tratarían de variables independientes y el modelo no funcionaría bien.

Check Also

configuracion acceso remoto jupyter notebook

Configuración de acceso remoto de Jupyter Notebook

Configuración completa para el acceso remoto de Jupyter Notebook desde JUNO Remote para Windows con password

Leave a Reply

Your email address will not be published. Required fields are marked *