Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:aprendizaje_automatico

¡Esta es una revisión vieja del documento!


[PAN] Aprendizaje Automático (Machine learning)

Introducción al aprendizaje automático

Carcterísticias de los sistemas de aprendizaje automático

El aprendizaje automático es una de las ramas de la Inteligencia Artificial centrada en el aprendizaje. Necesita muchos datos, sin los datos el aprendijaze automático no es nada. El aprendizaje automático se divide en 3 tipos:

  • Supervisado: Cada dato está asociado a una etiqueta que se usan para clasificar un dato.
    • Clasificación
    • Regresión
  • No supervisado: Solo tenemos datos y queremos localizar características comunes a los datos que tenemos. A veces puede ser previo al aprendizaje supervisado.
    • Reducción de la dimensionalidad
    • Clustering
  • Aprendizaje por refuerzo (Sistema de acción-recompensa):
    • Decisiones en tiempo real
    • IA de videojuegos

Generalización

Un modelo generaliza bien cuando es capaz de adaptarse a los datos actuales y a los futuros.

  • Sobreajuste (Overfitting): Se ajusta muy bien a los modelos de entrenamiento, pero falla con ejemplos nuevos
  • Underfitting: Predice mal los modelos de entrenamiento y lo hace peor con datos nuevos.

Como preparar datos para un modelo.

Cuando queremos preparar un modelo de aprendizaje automático debemos realizar las siguientes operaciones sobre los datos para obtener un modelo que se comporte bien:

  • Normalización (Scaling)
  • Recording of non numeric variables (Variables catergóricas): Se codifican con números (Si tenemos colores, por ejemplo, el rojo lo establecemos como el 1, el verde como el 2, el azul como el 3, etc….)
    • Se recomienda tanto contar la cantidad como el orden usando una matriz.
  • Elimination of spurious data (Noise): Si hay datos que se salgan mucho de la distribución de los datos de entrada se recomienda retirarlo para evitar comportamientos anómalos en el modelo.
  • Data imputation: Si para un elemento se desconocen algunos datos, se recomienda establecer un valor al campo en cuestión, esto se puede hacer de muchas formas como calcular la media, etc… En ocasiones estos registros también pueden ser eliminados si hay datos suficientes.
pan/aprendizaje_automatico.1761147091.txt.gz · Última modificación: 2025/10/22 15:31 por thejuanvisu