Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:machine_learning

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Próxima revisión
Revisión previa
pan:machine_learning [2024/10/30 16:33] – creado thejuanvisupan:machine_learning [2024/11/20 16:21] (actual) thejuanvisu
Línea 29: Línea 29:
  
 Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo. Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.
 +  * Aprendizaje Supervisado: Se usa para etiquetar con valores reales
 +  * Aprendizaje No supervisado: No hay etiqueta para los datos, se trata de establecer grupos en función de características comunes
 +  * Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta.
 +
 +==== Capacidad de genrealización y overfiting ====
 +  * Undefiting: El modelo se ajusta muy mal a los datos
 +  * Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, pero cuando le pasamos nuevos datos pierde sus capacidades
 +Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.
 +
 +==== Preparación y limpieza de datos ====
 +Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:
 +  * Normalización (Escalado)
 +  * Registro de variables no numéricas
 +  * Eliminación de datos sospechosos (Ruido)
 +  * Data Imputation
 +
 +===== Modelos Lineales supervisados =====
 +regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:
 +  * Variables explicativas: Son la entrada de variables del modelo
 +  * Ejemplos de entenamiento: Set de datos de variables explicativas para las cuales el valor de la variable a predecir es conocido.
 +
 +Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.
 +  * En el caso de un modelo lineal el modelo lineal es una función en términos de x.
 +
 +===== Métricas para evaluación de error =====
 +Se quiere medir el rendimiento del modelo una vez ha sido entrenado. 
 +  * Función de pérdida: Se usa para optimizar el modelo
 +  * Métricas de evaluación: Se utilizan para determinar el rendimiento del modelo
 +
 +==== Evaluación de error para regresión ====
 +  * Error cuadrático medio: 1/n * sumatorio(ti-yi)^2
 +  * Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio).
 +  * Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto.
 +  * Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi)
 +
 +==== Evaluación de error para métricas por clasificación ====
 +Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:
 +  * verdaderos positivo
 +  * falsos positivos
 +  * falsos negativos
 +  * verdaderos negativos
 +
 +Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)
 +  * TP: Verdadero Positivo
 +  * TN: Verdadero Negativo
 +  * FP: Falso Positivo
 +  * FN: Falso Negativo
 +
 +Sensibilidad: cuantos aciertos de los positivos se tienen
 +  * Sensibilidad = TP/(TP+FN)
 +
 +Especifibilidad: cuantos aciertos de negativos se tienen:
 +  * Especifibilidad = TN/CTN+FP)
 +
 +Precision: De todos los clasificados como positivos cuantos eran realmente positivos
 +  * Precisión: TP/(TP+FP)
 +
 +F1-Score:
 +
 +Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus  el rate de falsos positivos como una función 
 +
 +
 +===== Metodología para el análisis de resultados =====
 +
 +==== Redes neuronales artificiales ====
 +Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, que pueden recibir datos de las capas anteriores o siguientes.
  
pan/machine_learning.1730306018.txt.gz · Última modificación: 2024/10/30 16:33 por thejuanvisu