Muestra las diferencias entre dos versiones de la página.
| Próxima revisión | Revisión previa | ||
| pan:machine_learning [2024/10/30 16:33] – creado thejuanvisu | pan:machine_learning [2024/11/20 16:21] (actual) – thejuanvisu | ||
|---|---|---|---|
| Línea 29: | Línea 29: | ||
| Nos centramos en aprendizaje no supervisado, | Nos centramos en aprendizaje no supervisado, | ||
| + | * Aprendizaje Supervisado: | ||
| + | * Aprendizaje No supervisado: | ||
| + | * Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta. | ||
| + | |||
| + | ==== Capacidad de genrealización y overfiting ==== | ||
| + | * Undefiting: El modelo se ajusta muy mal a los datos | ||
| + | * Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, | ||
| + | Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible. | ||
| + | |||
| + | ==== Preparación y limpieza de datos ==== | ||
| + | Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es: | ||
| + | * Normalización (Escalado) | ||
| + | * Registro de variables no numéricas | ||
| + | * Eliminación de datos sospechosos (Ruido) | ||
| + | * Data Imputation | ||
| + | |||
| + | ===== Modelos Lineales supervisados ===== | ||
| + | regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es: | ||
| + | * Variables explicativas: | ||
| + | * Ejemplos de entenamiento: | ||
| + | |||
| + | Proceso de aprendizaje: | ||
| + | * En el caso de un modelo lineal el modelo lineal es una función en términos de x. | ||
| + | |||
| + | ===== Métricas para evaluación de error ===== | ||
| + | Se quiere medir el rendimiento del modelo una vez ha sido entrenado. | ||
| + | * Función de pérdida: Se usa para optimizar el modelo | ||
| + | * Métricas de evaluación: | ||
| + | |||
| + | ==== Evaluación de error para regresión ==== | ||
| + | * Error cuadrático medio: 1/n * sumatorio(ti-yi)^2 | ||
| + | * Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio). | ||
| + | * Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto. | ||
| + | * Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi) | ||
| + | |||
| + | ==== Evaluación de error para métricas por clasificación ==== | ||
| + | Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando: | ||
| + | * verdaderos positivo | ||
| + | * falsos positivos | ||
| + | * falsos negativos | ||
| + | * verdaderos negativos | ||
| + | |||
| + | Luego se calcula la accuracy: Aciertos/ | ||
| + | * TP: Verdadero Positivo | ||
| + | * TN: Verdadero Negativo | ||
| + | * FP: Falso Positivo | ||
| + | * FN: Falso Negativo | ||
| + | |||
| + | Sensibilidad: | ||
| + | * Sensibilidad = TP/(TP+FN) | ||
| + | |||
| + | Especifibilidad: | ||
| + | * Especifibilidad = TN/CTN+FP) | ||
| + | |||
| + | Precision: De todos los clasificados como positivos cuantos eran realmente positivos | ||
| + | * Precisión: TP/(TP+FP) | ||
| + | |||
| + | F1-Score: | ||
| + | |||
| + | Curva ROC (Receiver Operating Characteristic): | ||
| + | |||
| + | |||
| + | ===== Metodología para el análisis de resultados ===== | ||
| + | |||
| + | ==== Redes neuronales artificiales ==== | ||
| + | Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, | ||