Home / Computer Science / Machine Learning / Random Forest – Arboles de Decisión Machine Learning

Random Forest – Arboles de Decisión Machine Learning

random-forestRandom Forest es un algoritmo flexible de machine learning  que genera grandes resultados aún sin tunear los hyper-parameter. Es uno de los más usados y sirve tanto para clasificar como para regresiones.

Random Forest es un algoritmo de aprendizaje supervisado, es decir, que aprende en función de datos anteriores de los cuales se conoce la clase a la que pertenecen.

El forest que genera es de árboles de decisión mayormente generados con el método de bagging que se basa en en que la combinación de modelos aumenta el resultado general, es decir que, se generan varios árboles de decisión que se promedian para llegar a una decisión más estable y precisa.  

Con Random Forest se puede hacer regresiones mediante el Random Forest Regressor. El algoritmo, en vez de buscar el atributo más importante cuando divide un nodo, busca el mejor atributo entre un set aleatorio de atributos.

Una gran cualidad es que es sencillo medir la importancia de los atributos en la predicción. Sklearn provee una herramienta que mide la importancia de un atributo mirando cuanto un nodo, usando ese atributo, reduce la impureza.

Viendo así la importancia de los atributos, se puede definir eliminar algunos por no contribuir a la predicción. Esto es importante ya que es regla de machine learning que cuantos más atributos están en juego en la predicción, mayor es la probabilidad de caer en overfitting.

Los hiperparámetros son usados para mejorar la capacidad predictiva o aumentar la velocidad de cálculo: n_estimators (número de árboles). En general, cuantos más árboles se generan, más estable y preciso es el modelo pero el tiempo de computación aumenta. max_features (cantidad máxima de atributos que se consideran para partir un nodo), min_sample_leaf (minimo número de hojas necesarias para partir un nodo).

Es utilizado en innumerables aplicaciones, muy útil para sacar un modelo rápidamente aunque se puedan encontrar mejores pero que tomen más tiempo como una red neuronal.

Este video explica paso por paso la construcción de de un Random Forest. APM, Bam!

Titanic ProjectRandom Forest con PythonRandom Forest con R

About AVB

Check Also

Redes Neuronales Perceptrón Estructura, Tipos [Weka]

El ser humano ha tratado de recrear el funcionamiento del cerebro y proceso de aprendizaje …

Leave a Reply

Your email address will not be published. Required fields are marked *