Muestra las diferencias entre dos versiones de la página.
Próxima revisión | Revisión previa | ||
pan:machine_learning [2024/10/30 16:33] – creado thejuanvisu | pan:machine_learning [2024/11/20 16:21] (actual) – thejuanvisu | ||
---|---|---|---|
Línea 29: | Línea 29: | ||
Nos centramos en aprendizaje no supervisado, | Nos centramos en aprendizaje no supervisado, | ||
+ | * Aprendizaje Supervisado: | ||
+ | * Aprendizaje No supervisado: | ||
+ | * Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta. | ||
+ | |||
+ | ==== Capacidad de genrealización y overfiting ==== | ||
+ | * Undefiting: El modelo se ajusta muy mal a los datos | ||
+ | * Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, | ||
+ | Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible. | ||
+ | |||
+ | ==== Preparación y limpieza de datos ==== | ||
+ | Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es: | ||
+ | * Normalización (Escalado) | ||
+ | * Registro de variables no numéricas | ||
+ | * Eliminación de datos sospechosos (Ruido) | ||
+ | * Data Imputation | ||
+ | |||
+ | ===== Modelos Lineales supervisados ===== | ||
+ | regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es: | ||
+ | * Variables explicativas: | ||
+ | * Ejemplos de entenamiento: | ||
+ | |||
+ | Proceso de aprendizaje: | ||
+ | * En el caso de un modelo lineal el modelo lineal es una función en términos de x. | ||
+ | |||
+ | ===== Métricas para evaluación de error ===== | ||
+ | Se quiere medir el rendimiento del modelo una vez ha sido entrenado. | ||
+ | * Función de pérdida: Se usa para optimizar el modelo | ||
+ | * Métricas de evaluación: | ||
+ | |||
+ | ==== Evaluación de error para regresión ==== | ||
+ | * Error cuadrático medio: 1/n * sumatorio(ti-yi)^2 | ||
+ | * Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio). | ||
+ | * Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto. | ||
+ | * Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi) | ||
+ | |||
+ | ==== Evaluación de error para métricas por clasificación ==== | ||
+ | Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando: | ||
+ | * verdaderos positivo | ||
+ | * falsos positivos | ||
+ | * falsos negativos | ||
+ | * verdaderos negativos | ||
+ | |||
+ | Luego se calcula la accuracy: Aciertos/ | ||
+ | * TP: Verdadero Positivo | ||
+ | * TN: Verdadero Negativo | ||
+ | * FP: Falso Positivo | ||
+ | * FN: Falso Negativo | ||
+ | |||
+ | Sensibilidad: | ||
+ | * Sensibilidad = TP/(TP+FN) | ||
+ | |||
+ | Especifibilidad: | ||
+ | * Especifibilidad = TN/CTN+FP) | ||
+ | |||
+ | Precision: De todos los clasificados como positivos cuantos eran realmente positivos | ||
+ | * Precisión: TP/(TP+FP) | ||
+ | |||
+ | F1-Score: | ||
+ | |||
+ | Curva ROC (Receiver Operating Characteristic): | ||
+ | |||
+ | |||
+ | ===== Metodología para el análisis de resultados ===== | ||
+ | |||
+ | ==== Redes neuronales artificiales ==== | ||
+ | Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, | ||