Machine Learning

Machine learning quiere desarrollar algoritmos que permiten que las máquinas puedan aprender. Desarrolla modelos computacionales para resolver problemas complejos.

Fundamentos del machine learning

Características de los sistemas Machine Learning

General AI: Trata de desarrollar sistemas que resuelva problemas muy complejos de forma genérica
Specialized AI: Se desarrollan sistemas que van a realizar una determinada tarea

La inteligencia artificial tiene muchas ramas:

Machine Learning
- Deep Learning
- Shallow Learning
Natural Language Processing
- Translation
- Text Generation
- Information retrieval
Speech Processing
- Voice to Text
- Text to voice
Expert Systems
Planning and Optimization
Robotics Vision

Cuando es apropiado usar Machine Learning

Si no se necesita tener conocimiento explícito, pero se tienen datos, es cuando es adecuado usar Machine Learning. Se dispone de datos que varían con el tiempo. Se suelen aplicar también cuando se reciben datos de forma continua con nueva información que haga que el sistema tenga que adaptarse a los cambios.

Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.

Aprendizaje Supervisado: Se usa para etiquetar con valores reales
Aprendizaje No supervisado: No hay etiqueta para los datos, se trata de establecer grupos en función de características comunes
Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta.

Capacidad de genrealización y overfiting

Undefiting: El modelo se ajusta muy mal a los datos
Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, pero cuando le pasamos nuevos datos pierde sus capacidades

Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.

Preparación y limpieza de datos

Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:

Normalización (Escalado)
Registro de variables no numéricas
Eliminación de datos sospechosos (Ruido)
Data Imputation

Modelos Lineales supervisados

regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:

Variables explicativas: Son la entrada de variables del modelo
Ejemplos de entenamiento: Set de datos de variables explicativas para las cuales el valor de la variable a predecir es conocido.

Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.

En el caso de un modelo lineal el modelo lineal es una función en términos de x.

Métricas para evaluación de error

Se quiere medir el rendimiento del modelo una vez ha sido entrenado.

Función de pérdida: Se usa para optimizar el modelo
Métricas de evaluación: Se utilizan para determinar el rendimiento del modelo

Evaluación de error para regresión

Error cuadrático medio: 1/n * sumatorio(ti-yi)^2
Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio).
Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto.
Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi)

Evaluación de error para métricas por clasificación

Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:

verdaderos positivo
falsos positivos
falsos negativos
verdaderos negativos

Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)

TP: Verdadero Positivo
TN: Verdadero Negativo
FP: Falso Positivo
FN: Falso Negativo

Sensibilidad: cuantos aciertos de los positivos se tienen

Sensibilidad = TP/(TP+FN)

Especifibilidad: cuantos aciertos de negativos se tienen:

Especifibilidad = TN/CTN+FP)

Precision: De todos los clasificados como positivos cuantos eran realmente positivos

Precisión: TP/(TP+FP)

F1-Score:

Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus el rate de falsos positivos como una función

Metodología para el análisis de resultados

Redes neuronales artificiales

Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, que pueden recibir datos de las capas anteriores o siguientes.