Tabla de Contenidos

Machine Learning

Machine learning quiere desarrollar algoritmos que permiten que las máquinas puedan aprender. Desarrolla modelos computacionales para resolver problemas complejos.

Fundamentos del machine learning

Características de los sistemas Machine Learning

La inteligencia artificial tiene muchas ramas:

Cuando es apropiado usar Machine Learning

Si no se necesita tener conocimiento explícito, pero se tienen datos, es cuando es adecuado usar Machine Learning. Se dispone de datos que varían con el tiempo. Se suelen aplicar también cuando se reciben datos de forma continua con nueva información que haga que el sistema tenga que adaptarse a los cambios.

Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.

Capacidad de genrealización y overfiting

Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.

Preparación y limpieza de datos

Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:

Modelos Lineales supervisados

regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:

Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.

Métricas para evaluación de error

Se quiere medir el rendimiento del modelo una vez ha sido entrenado.

Evaluación de error para regresión

Evaluación de error para métricas por clasificación

Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:

Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)

Sensibilidad: cuantos aciertos de los positivos se tienen

Especifibilidad: cuantos aciertos de negativos se tienen:

Precision: De todos los clasificados como positivos cuantos eran realmente positivos

F1-Score:

Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus el rate de falsos positivos como una función

Metodología para el análisis de resultados