Knoppia

Wiki de Informática y otras historias

Herramientas de usuario

Herramientas del sitio


pan:machine_learning

Machine Learning

Machine learning quiere desarrollar algoritmos que permiten que las máquinas puedan aprender. Desarrolla modelos computacionales para resolver problemas complejos.

Fundamentos del machine learning

Características de los sistemas Machine Learning

  • General AI: Trata de desarrollar sistemas que resuelva problemas muy complejos de forma genérica
  • Specialized AI: Se desarrollan sistemas que van a realizar una determinada tarea

La inteligencia artificial tiene muchas ramas:

  • Machine Learning
    • Deep Learning
    • Shallow Learning
  • Natural Language Processing
    • Translation
    • Text Generation
    • Information retrieval
  • Speech Processing
    • Voice to Text
    • Text to voice
  • Expert Systems
  • Planning and Optimization
  • Robotics Vision

Cuando es apropiado usar Machine Learning

Si no se necesita tener conocimiento explícito, pero se tienen datos, es cuando es adecuado usar Machine Learning. Se dispone de datos que varían con el tiempo. Se suelen aplicar también cuando se reciben datos de forma continua con nueva información que haga que el sistema tenga que adaptarse a los cambios.

Nos centramos en aprendizaje no supervisado, aprendizaje supervisado y aprendizaje por refuerzo.

  • Aprendizaje Supervisado: Se usa para etiquetar con valores reales
  • Aprendizaje No supervisado: No hay etiqueta para los datos, se trata de establecer grupos en función de características comunes
  • Aprendizaje por Refuerzo: Se reciben recompensas cada vez que se realiza una acción correcta.

Capacidad de genrealización y overfiting

  • Undefiting: El modelo se ajusta muy mal a los datos
  • Overfiting: El modelo se ajusta muy bien a los datos de entrenamiento, pero cuando le pasamos nuevos datos pierde sus capacidades

Se debe encontrar un termino medio entre underfiting y overfiting de forma que cada vez que se presenten datos nuevos el resultado sea lo más preciso posible.

Preparación y limpieza de datos

Antes de usar datos para entrenar un modelo es necesario preparar los datos, lo que se suele hacer es:

  • Normalización (Escalado)
  • Registro de variables no numéricas
  • Eliminación de datos sospechosos (Ruido)
  • Data Imputation

Modelos Lineales supervisados

regresión: Busca predecir el valor de una o más variables dado el valor de un set de variables explicativas representadas por un vector x de dimensión an*m. Los elementos clave para predecir el valor de las variables es:

  • Variables explicativas: Son la entrada de variables del modelo
  • Ejemplos de entenamiento: Set de datos de variables explicativas para las cuales el valor de la variable a predecir es conocido.

Proceso de aprendizaje: Se quieren obtener los parámetros optimos que permitan obtener las salidas más ajustadas posibles.

  • En el caso de un modelo lineal el modelo lineal es una función en términos de x.

Métricas para evaluación de error

Se quiere medir el rendimiento del modelo una vez ha sido entrenado.

  • Función de pérdida: Se usa para optimizar el modelo
  • Métricas de evaluación: Se utilizan para determinar el rendimiento del modelo

Evaluación de error para regresión

  • Error cuadrático medio: 1/n * sumatorio(ti-yi)^2
  • Raiz de Error Cuadrático medio: RaizCuadrada(Error cuadratico medio).
  • Error absoluto Medio: como el Error cuadrático medio, pero en valor absoluto.
  • Error medio porcentual medio: 100/n* sumatorio((ti-yi) / yi)

Evaluación de error para métricas por clasificación

Se construye una matriz de confusión que almacena el número de casos que coinciden y en los que no, almacenando:

  • verdaderos positivo
  • falsos positivos
  • falsos negativos
  • verdaderos negativos

Luego se calcula la accuracy: Aciertos/Total = (TP+TN) / (TP+TN+FP+FN)

  • TP: Verdadero Positivo
  • TN: Verdadero Negativo
  • FP: Falso Positivo
  • FN: Falso Negativo

Sensibilidad: cuantos aciertos de los positivos se tienen

  • Sensibilidad = TP/(TP+FN)

Especifibilidad: cuantos aciertos de negativos se tienen:

  • Especifibilidad = TN/CTN+FP)

Precision: De todos los clasificados como positivos cuantos eran realmente positivos

  • Precisión: TP/(TP+FP)

F1-Score:

Curva ROC (Receiver Operating Characteristic): Muestra la sensitividad versus el rate de falsos positivos como una función

Metodología para el análisis de resultados

Redes neuronales artificiales

Se organizan en capas, pueden ser de una sola capa o multicapa. Pueden ser hacia delante (Reciben cosas de la capa anterior) o Recurrentes, que pueden recibir datos de las capas anteriores o siguientes.

pan/machine_learning.txt · Última modificación: 2024/11/20 16:21 por thejuanvisu