Diferencias

Muestra las diferencias entre dos versiones de la página.

--- pan:machine_learning [2024/10/30 16:33] – creado thejuanvisu
+++ pan:machine_learning [2024/11/20 16:21] (actual) – thejuanvisu
@@ Línea 29: / Línea 29: @@
 Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.
+  * Aprendizaje Supervisado: Se usa para etiquetar con valores reales
+  * Aprendizaje No supervisado: No hay etiqueta para los datos, se trata de establecer grupos en función de características comunes
+  * Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta.
+==== Capacidad de genrealización y overfiting ====
+  * Undefiting: El modelo se ajusta muy mal a los datos
+  * Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, pero cuando le pasamos nuevos datos pierde sus capacidades
+Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.
+==== Preparación y limpieza de datos ====
+Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:
+  * Normalización (Escalado)
+  * Registro de variables no numéricas
+  * Eliminación de datos sospechosos (Ruido)
+  * Data Imputation
+===== Modelos Lineales supervisados =====
+regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:
+  * Variables explicativas: Son la entrada de variables del modelo
+  * Ejemplos de entenamiento: Set de datos de variables explicativas para las cuales el valor de la variable a predecir es conocido.
+Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.
+  * En el caso de un modelo lineal el modelo lineal es una función en términos de x.
+===== Métricas para evaluación de error =====
+Se quiere medir el rendimiento del modelo una vez ha sido entrenado.
+  * Función de pérdida: Se usa para optimizar el modelo
+  * Métricas de evaluación: Se utilizan para determinar el rendimiento del modelo
+==== Evaluación de error para regresión ====
+  * Error cuadrático medio: 1/n * sumatorio(ti-yi)^2
+  * Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio).
+  * Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto.
+  * Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi)
+==== Evaluación de error para métricas por clasificación ====
+Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:
+  * verdaderos positivo
+  * falsos positivos
+  * falsos negativos
+  * verdaderos negativos
+Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)
+  * TP: Verdadero Positivo
+  * TN: Verdadero Negativo
+  * FP: Falso Positivo
+  * FN: Falso Negativo
+Sensibilidad: cuantos aciertos de los positivos se tienen
+  * Sensibilidad = TP/(TP+FN)
+Especifibilidad: cuantos aciertos de negativos se tienen:
+  * Especifibilidad = TN/CTN+FP)
+Precision: De todos los clasificados como positivos cuantos eran realmente positivos
+  * Precisión: TP/(TP+FP)
+F1-Score:
+Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus  el rate de falsos positivos como una función
+===== Metodología para el análisis de resultados =====
+==== Redes neuronales artificiales ====
+Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, que pueden recibir datos de las capas anteriores o siguientes.

Knoppia

Herramientas de usuario

Herramientas del sitio

Diferencias

Herramientas de la página