Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:machine_learning_v2

¡Esta es una revisión vieja del documento!


Fundamentos del Machine Learning

Que es la inteligencia artificial

  • IA General: Trata de desarrollar un sistema que presenta la flexibilidad y versatilidad de la inteligencia humana para resolver un amplio rando de problemas cognitivos complejos.
  • IA Especializada: Trata de desarrollar sistemas que pueden ser usados solo para las tareas para los que fueron diseñados.

Que es el machine learning

Es una rama de la IA que trata de desarrollar algoritmos que permitan a las máquinas aprender. Se busca desarrollar modelos computacionales que sean capaces de resolver problemas complejos usando como base ejemplos.

Cuando es apropiado usar machine learning

  • Si no se tiene suficiente conocimiento explícito para obtener un algoritmo para resolver el problema, pero se tienen ejemplos de como se resuelve.
  • Si el problema a resolver varía con el tiempo.
  • Si los datos llegan continuamente y contienen nueva información que permite mejorar el sistema con el tiempo.

Generalización

Término usado para describir la capacidad de un modelo para clasificar o predecir nuevos datos correctamente. Hay 2 conceptos importantes relacionados con la generalización:

  • Underfitting: El modelo no trabaja bien con los datos.
  • Overfitting: El modelo trabaja demasiado bien con los datos, los memoriza, pero hace predicciones poco fiables con datos nuevos.

Hay que encontrar un balance entre estos 2 conceptos.

Praparación y limpieza de datos

Antes de usar datos para entrenar un modelo, suele ser necesario realizar ciertas preparaciones de los datos como:

  • Normalizar los datos (Scaling)
  • REcodificar las variables no-numéricas
  • Eliminación de ruido y datos sin sentido
  • Imputación de datos

Modelos lineales de aprendizaje supervisado

Primero debemos conocer las notaciones y definiciones:

  • Vectores: Vienen como matrices en columna
    • Producto de vectores:

\(\mathbf{x}^\top \mathbf{y} = [x_1, x_2, \ldots, x_m]\begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_m \end{bmatrix} = x_1 y_1 + x_2 y_2 + \cdots + x_m y_m\)

  • Norma de un vector

$||x|| = \sqrt{X^T X} = \sqrt{X_1^2 + x_2^2 + X^2_m}$

Métodos de regresión lineal

Tienen como objetivo predecir una o más variables continuas dado el valor de un set explicativo de variables repesentado por un vector $X$ con dimensión $m$

$ X = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_m \end{bmatrix}$

Para predecir los valores de las variables tenemos los siguientes elementos clave:

  • Variables explicativas: variables de entrada del modelo
  • Ejemplos de entrenamiento: Un grupo de $n$ datos $x_1 ... x_n$ de las variables explicativas para el cual el valor de la variable a ser predecido es conocido $t_1,...,t_n$
  • Un Modelo: Es una función parametrizable $W$ que representa la relación entre $x$ y $t$
  • Función objetivo (o error o coste) que indica como de bien tiene que aproximar el modelo los datos de entrenamiento
  • Un método de optimización para encontrar el modelo óptimo minimizando la función objetivo.
pan/machine_learning_v2.1767811562.txt.gz · Última modificación: 2026/01/07 18:46 por thejuanvisu