Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:aprendizaje_automatico

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Próxima revisión
Revisión previa
pan:aprendizaje_automatico [2025/10/22 15:26] – creado thejuanvisupan:aprendizaje_automatico [2025/10/22 15:35] (actual) thejuanvisu
Línea 19: Línea 19:
   * Sobreajuste (Overfitting): Se ajusta muy bien a los modelos de entrenamiento, pero falla con ejemplos nuevos   * Sobreajuste (Overfitting): Se ajusta muy bien a los modelos de entrenamiento, pero falla con ejemplos nuevos
   * Underfitting: Predice mal los modelos de entrenamiento y lo hace peor con datos nuevos.   * Underfitting: Predice mal los modelos de entrenamiento y lo hace peor con datos nuevos.
 +
 +===== Como preparar datos para un modelo. =====
 +Cuando queremos preparar un modelo de aprendizaje automático debemos realizar las siguientes operaciones sobre los datos para obtener un modelo que se comporte bien:
 +  * Normalización (Scaling)
 +  * Recording of non numeric variables (Variables catergóricas): Se codifican con números (Si tenemos colores, por ejemplo, el rojo lo establecemos como el 1, el verde como el 2, el azul como el 3, etc....)
 +    * Se recomienda tanto contar la cantidad como el orden usando una matriz.
 +  * Elimination of spurious data (Noise): Si hay datos que se salgan mucho de la distribución de los datos de entrada se recomienda retirarlo para evitar comportamientos anómalos en el modelo.
 +  * Data imputation: Si para un elemento se desconocen algunos datos, se recomienda establecer un valor al campo en cuestión, esto se puede hacer de muchas formas como calcular la media, etc... En ocasiones estos registros también pueden ser eliminados si hay datos suficientes.
 +
 +
 +====== Aprendizaje Supervisado: Modelos Lineales ======
 +
 +
  
  
pan/aprendizaje_automatico.1761146800.txt.gz · Última modificación: 2025/10/22 15:26 por thejuanvisu