Machine learning quiere desarrollar algoritmos que permiten que las máquinas puedan aprender. Desarrolla modelos computacionales para resolver problemas complejos.
La inteligencia artificial tiene muchas ramas:
Si no se necesita tener conocimiento explícito, pero se tienen datos, es cuando es adecuado usar Machine Learning. Se dispone de datos que varían con el tiempo. Se suelen aplicar también cuando se reciben datos de forma continua con nueva información que haga que el sistema tenga que adaptarse a los cambios.
Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.
Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.
Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:
regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:
Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.
Se quiere medir el rendimiento del modelo una vez ha sido entrenado.
Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:
Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)
Sensibilidad: cuantos aciertos de los positivos se tienen
Especifibilidad: cuantos aciertos de negativos se tienen:
Precision: De todos los clasificados como positivos cuantos eran realmente positivos
F1-Score:
Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus el rate de falsos positivos como una función