Data Leakage Machine Learning

Existen los casos en que después de entrenar un modelo con resultados del 99% de accuracy, fracasa vergonzosamente cuando se lo expone a un nuevo dataset. En varias oportunidades, la razón de esto se debe al data leakage. Demasiado bueno para ser verdad Esto ocurre cuando, de alguna manera, información …

Read More »

Egiptología – Cronología y Geografía

Veremos el lento y gradual proceso que condujo desde las primeras sociedades neolíticas del valle del Nilo hasta las primeras dinastías faraónicas esencialmente, durante el cuarto milenio antes de Cristo. Recordemos las tres etapas centrales de la historia de Egipto: Reino Antiguo, Reino Medio y Reino Nuevo. Los ingleses y …

Read More »

Web Scraping con Python y BeautifulSoup

web scraping python beautiful soup matplotlib panda

El web scraping es una buena habilidad para diferentes usos más allá de que se sea un científico de datos o no. Mucha información que reside en la web es útil para ser analizada y elaborada. Este post sobre web scraping con Python, está dividido en tres partes. • Extracción …

Read More »

Comparación de cámaras Samsung A80 y iPhone10

Para la comparación de cámaras entre el Samsun A80 de 48 Mega Pixels y el iPhone X de 12 Mega Pixels, hemos sacado diferentes fotografías de la misma escena con diferentes apps ya que la alaboración digital de la aplicación es muy importante hoy día. Es así que el dispositivo …

Read More »

Notas sobre Numpy

Shape array_1 = np.arange(10)     # como si fuera un range array_1.shape   ->    (10L,) array_1.reshape((5,2)) < array([[0, 1], [2, 3], [4, 5], [6, 7], [8, 9]]) array_1.ndim     ->   2 Broadcasting array_1 + 1  # le suma uno a todos sus elementos. array([[ 1, 2], [ 3, 4], [ 5, 6], [ …

Read More »

Regresión Lineal – Variables Dummy

Las regresiones lineales multivariables, consisten en una variable dependiente y varias independientes. Por ejemplo: En este caso, x1, x2, x3, representan valores numéricos de la tabla pero D4 es una representación de la columna State que es Categórico. Para procesarlo, se genera una columna New York Dummy booleana que guarda …

Read More »

Notas sobre Python

Tipos de variables boolean, int, floats, complex, strings, tuples y lists type(expression) devuelve el tipo de variable, type(True):bool  –  True con mayúculas. Casting  float(2):2.0   int(1.1):1    int(‘1’):1    int(‘A’) Error    str(1):”1”    str(4.5):’4.5’    int(True):1  bool(0): False 25 // 6 –> 4 Integer division Strings Son objetos que tienen sus métodos propios. Name = …

Read More »

Notas sobre NetLogo

NetLogo tiene 3 tipos de objetos relevantes, patches (cuadrícula del fondo), turtles (objetos moviles) y links (relaciones entre turtles. Los patches y turtles tienen sus propiedades como coordenadas, color, shape, etc. Se pueden generar subset predeterminados con turtles-here (las que están sobre un patch determinado) o in-link-neighbors (los que están …

Read More »