types machine learning
Este tutorial explica los tipos de aprendizaje automático, es decir, aprendizaje supervisado, no supervisado, reforzado y semi-supervisado con ejemplos simples. También aprenderá las diferencias entre el aprendizaje supervisado y el aprendizaje no supervisado:
En el Tutorial anterior , hemos aprendido sobre Machine Learning, su funcionamiento y sus aplicaciones. También hemos visto una comparación entre el aprendizaje automático y la inteligencia artificial.
El aprendizaje automático es un campo de la ciencia que se ocupa del aprendizaje de programas informáticos a través de la experiencia y la predicción del resultado.
La característica principal de ML es aprender de la experiencia. El aprendizaje ocurre cuando el sistema alimentado con datos de entrada de entrenamiento realiza cambios en sus parámetros y se ajusta para dar la salida deseada. La salida es el valor objetivo definido en los datos de entrenamiento.
=> Lea la serie completa de capacitación sobre aprendizaje automático
Lo que vas a aprender:
- Tipos de aprendizaje automático
- Ejemplo de la vida real de aprendizaje supervisado y no supervisado
- Diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado
- Aprendizaje semi-supervisado
- Conclusión
Tipos de aprendizaje automático
Los programas de aprendizaje automático se clasifican en 3 tipos como se muestra a continuación.
- Supervisado
- Sin supervisión
- Aprendizaje reforzado
¡Entendamos cada uno de estos en detalle!
# 1) Aprendizaje supervisado
El aprendizaje supervisado ocurre en presencia de un supervisor al igual que el aprendizaje realizado por un niño pequeño con la ayuda de su maestro. Como un niño está entrenado para reconocer frutas, colores, números bajo la supervisión de un maestro, este método es aprendizaje supervisado.
En este método, el maestro verifica cada paso del niño y el niño aprende del resultado que tiene que producir.
¿Cómo funciona el aprendizaje supervisado?
En el algoritmo ML supervisado, la salida ya se conoce. Hay un mapeo de entrada con salida. Por lo tanto, para crear un modelo, la máquina se alimenta con una gran cantidad de datos de entrada de entrenamiento (teniendo la entrada y la salida correspondiente conocidas).
Los datos de entrenamiento ayudan a lograr un nivel de precisión para el modelo de datos creado. El modelo construido ahora está listo para ser alimentado con nuevos datos de entrada y predecir los resultados.
¿Qué es un conjunto de datos etiquetado?
El conjunto de datos con salidas conocidas para una entrada determinada se denomina Conjunto de datos etiquetado. Por ejemplo, se conoce una imagen de fruta junto con el nombre de la fruta. Entonces, cuando se muestra una nueva imagen de fruta, se compara con el conjunto de entrenamiento para predecir la respuesta.
El aprendizaje supervisado es un mecanismo de aprendizaje rápido con alta precisión. Los problemas de aprendizaje supervisado incluyen problemas de regresión y clasificación.
Algunos de los algoritmos de aprendizaje supervisado son:
- Árboles de decisión,
- K-Vecino más cercano,
- Regresión lineal,
- Soporte Vector Machine y
- Redes neuronales.
Ejemplo de aprendizaje supervisado
- En el primer paso, se envía un conjunto de datos de entrenamiento al algoritmo de aprendizaje automático.
- Con el conjunto de datos de entrenamiento, la máquina se ajusta a sí misma al realizar cambios en los parámetros para construir un modelo lógico.
- El modelo construido se utiliza luego para un nuevo conjunto de datos para predecir el resultado.
Tipos de algoritmos de aprendizaje supervisado
- Clasificación: En este tipo de problemas, predecimos la respuesta como clases específicas, como 'sí' o 'no'. Cuando solo hay 2 clases, se denomina Clasificación Binaria. Para más de 2 valores de clase, se denomina Clasificación de clases múltiples. Los valores de respuesta predichos son valores discretos. Por ejemplo, ¿Es la imagen del sol o la luna? El algoritmo de clasificación separa los datos en clases.
- Regresión: Los problemas de regresión predicen la respuesta como valores continuos, como la predicción de un valor que va de -infinito a infinito. Puede que sean necesarios muchos valores. Por ejemplo, el algoritmo de regresión lineal que se aplica predice el costo de la casa en base a muchos parámetros como ubicación, aeropuerto cercano, tamaño de la casa, etc.
# 2) Aprendizaje no supervisado
El aprendizaje no supervisado ocurre sin la ayuda de un supervisor, al igual que un pez aprende a nadar por sí mismo. Es un proceso de aprendizaje independiente.
En este modelo, como no hay una salida mapeada con la entrada, los valores objetivo son desconocidos / sin etiquetar. El sistema necesita aprender por sí mismo de la entrada de datos y detectar los patrones ocultos.
¿Qué es un conjunto de datos sin etiquetar?
Un conjunto de datos con valores de salida desconocidos para todos los valores de entrada se denomina conjunto de datos sin etiquetar.
¿Cómo funciona el aprendizaje no supervisado?
Como no hay valores de salida conocidos que se puedan usar para construir un modelo lógico entre la entrada y la salida, se utilizan algunas técnicas para extraer reglas de datos, patrones y grupos de datos con tipos similares. Estos grupos ayudan a los usuarios finales a comprender mejor los datos y a encontrar una salida significativa.
Las entradas alimentadas no tienen la forma de una estructura adecuada al igual que los datos de entrenamiento (en el aprendizaje supervisado). Puede contener valores atípicos, datos ruidosos, etc. Estas entradas se alimentan juntas al sistema. Mientras se entrena el modelo, las entradas se organizan para formar grupos.
mejor VPN gratis para fire stick
Los algoritmos de aprendizaje no supervisados incluyen algoritmos de agrupación y asociación como:
- A priori,
- Clústeres de K-medias y otros algoritmos de minería de reglas de asociación.
Cuando se envían nuevos datos al modelo, predecirá el resultado como una etiqueta de clase a la que pertenece la entrada. Si la etiqueta de la clase no está presente, se generará una nueva clase.
Mientras se somete al proceso de descubrimiento de patrones en los datos, el modelo ajusta sus parámetros por sí mismo, por lo que también se denomina autoorganización. Los clústeres se formarán al descubrir las similitudes entre las entradas.
Por ejemplo, al comprar productos en línea, si se pone mantequilla en el carrito, sugiere comprar pan, queso, etc. El modelo no supervisado observa los puntos de datos y predice los otros atributos asociados con el producto.
Ejemplo de aprendizaje no supervisado
Tipos de algoritmos no supervisados
- Algoritmo de agrupación : El método para encontrar las similitudes entre elementos de datos como la misma forma, tamaño, color, precio, etc. y agruparlos para formar un grupo es el análisis de grupos.
- Detección de valores atípicos : En este método, el conjunto de datos es la búsqueda de cualquier tipo de disimilitudes y anomalías en los datos. Por ejemplo, El sistema detecta una transacción de alto valor con tarjeta de crédito para la detección de fraude.
- Minería de reglas de asociación : En este tipo de minería, descubre los conjuntos de elementos o asociaciones entre elementos que ocurren con más frecuencia. Asociaciones como 'productos que a menudo se compran juntos', etc.
- Autoencoders: La entrada se comprime en una forma codificada y se recrea para eliminar datos ruidosos. Esta técnica se utiliza para mejorar la calidad de la imagen y el video.
# 3) Aprendizaje por refuerzo
En este tipo de aprendizaje, el algoritmo aprende mediante un mecanismo de retroalimentación y experiencias pasadas. Siempre se desea que se dé cada paso del algoritmo para alcanzar una meta.
Por lo tanto, cada vez que se va a dar el siguiente paso, recibe la retroalimentación del paso anterior, junto con el aprendizaje de la experiencia para predecir cuál podría ser el siguiente mejor paso. Este proceso también se denomina proceso de prueba y error para alcanzar la meta.
El aprendizaje por refuerzo es un proceso iterativo a largo plazo. Cuanto mayor sea el número de comentarios, más preciso será el sistema. El aprendizaje por refuerzo básico también se denomina Proceso de decisión de Markov.
Ejemplo de aprendizaje por refuerzo
Un ejemplo de aprendizaje por refuerzo son los videojuegos, donde los jugadores completan ciertos niveles de un juego y ganan puntos de recompensa. El juego proporciona información al jugador a través de movimientos de bonificación para mejorar su rendimiento.
El aprendizaje por refuerzo se utiliza en la formación de robots, coches autónomos, gestión automática de inventario, etc.
Algunos algoritmos populares de aprendizaje por refuerzo incluyen:
- Q-Learning,
- Redes de gran rivalidad
- Diferencia temporal
La siguiente figura describe el mecanismo de retroalimentación del aprendizaje por refuerzo.
- La entrada es observada por el agente que es el elemento AI.
- Este agente de IA actúa sobre el medio ambiente según la decisión que se tome.
- La respuesta del entorno se envía a la IA en forma de recompensa como retroalimentación.
- También se guardan el estado y la acción realizada en el medio ambiente.
(imagen fuente )
Ejemplo de la vida real de aprendizaje supervisado y no supervisado
Para aprendizaje supervisado:
#1) Tomemos un ejemplo de una cesta de verduras con cebolla, zanahoria, rábano, tomate, etc., y las podemos ordenar en forma de grupos.
#2) Creamos una tabla de datos de entrenamiento para comprender el aprendizaje supervisado.
La tabla de datos de entrenamiento caracteriza las verduras en función de:
- Forma
- Color
- Tamaño
Forma | Color | Tamaño | Vegetal |
---|---|---|---|
Es más preciso que el aprendizaje no supervisado, ya que los datos de entrada y la salida correspondiente son bien conocidos, y la máquina solo necesita dar predicciones. | Tiene menos precisión ya que los datos de entrada no están etiquetados. Por lo tanto, la máquina primero debe comprender y etiquetar los datos y luego dar predicciones. | ||
Redondo | marrón | Grande | Cebolla |
Redondo | Red | Medio | Tomate |
Cilíndrico | blanco | Grande | Rábano |
Cilíndrico | Red | Medio | Zanahoria |
Cuando esta tabla de datos de entrenamiento se alimenta a la máquina, construirá un modelo lógico usando la forma, color, tamaño de la verdura, etc., para predecir el resultado (verdura).
A medida que se alimenta una nueva entrada a este modelo, el algoritmo analizará los parámetros y generará el nombre de la fruta.
Para el aprendizaje no supervisado:
En el aprendizaje no supervisado, crea grupos o conglomerados basados en atributos. En el conjunto de datos de muestra anterior, los parámetros de vegetales son:
# 1) Forma
Las verduras se agrupan según la forma.
- Redondo: Cebolla y Tomate.
- Cilíndrico: Rábano y Zanahoria.
Tome otro parámetro como el tamaño.
# 2) Tamaño
Las verduras se agrupan según el tamaño y la forma:
- Tamaño mediano y forma redonda: Tomate
- Tamaño grande y forma redonda: Cebolla
En el aprendizaje no supervisado, no tenemos ningún conjunto de datos de entrenamiento ni variable de resultado, mientras que en el aprendizaje supervisado, los datos de entrenamiento son conocidos y se utilizan para entrenar el algoritmo.
Diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado
Supervisado | Sin supervisión |
---|---|
En los algoritmos de aprendizaje supervisado, se conoce la salida para la entrada dada. | En los algoritmos de aprendizaje no supervisados, se desconoce el resultado de la entrada dada. |
Los algoritmos aprenden del conjunto de datos etiquetados. Estos datos ayudan a evaluar la precisión de los datos de entrenamiento. | El algoritmo se proporciona con datos sin etiquetar donde intenta encontrar patrones y asociaciones entre los elementos de datos. |
Es una técnica de modelado predictivo que predice los resultados futuros con precisión. | Es una técnica de Modelado Descriptivo que explica la relación real entre los elementos y la historia de los elementos. |
Incluye algoritmos de clasificación y regresión. | Incluye algoritmos de aprendizaje de reglas de agrupación y asociación. |
Algunos algoritmos de aprendizaje supervisado son Regresión lineal, Naïve Bayes y Redes neuronales. | Algunos algoritmos para el aprendizaje no supervisado son k- significa agrupamiento, Apriori, etc. |
Este tipo de aprendizaje es relativamente complejo ya que requiere datos etiquetados. | Es menos complejo ya que no es necesario comprender ni etiquetar los datos. |
Es un proceso en línea de análisis de datos y no requiere interacción humana. | Este es un análisis de datos en tiempo real. |
Aprendizaje semi-supervisado
El enfoque de aprendizaje semi-supervisado toma la entrada de datos de entrenamiento tanto etiquetados como no etiquetados. Este tipo de aprendizaje es útil cuando es difícil extraer características útiles de datos sin etiquetar (enfoque supervisado) y los expertos en datos tienen dificultades para etiquetar los datos de entrada (enfoque sin supervisión).
Solo una pequeña cantidad de datos etiquetados en estos algoritmos puede conducir a la precisión del modelo.
Ejemplos del aprendizaje semi-supervisado incluyen tomografías computarizadas y resonancias magnéticas, en las que un experto médico puede etiquetar algunos puntos en las exploraciones para cualquier enfermedad, mientras que es difícil etiquetar todas las exploraciones.
Conclusión
Las tareas de aprendizaje automático se clasifican en general en tareas supervisadas, no supervisadas, semi supervisadas y de aprendizaje reforzado.
El aprendizaje supervisado es aprender con la ayuda de datos etiquetados. Los algoritmos ML se alimentan con un conjunto de datos de entrenamiento en el que se conoce la salida de cada dato de entrada, para predecir resultados futuros.
Este modelo es muy preciso y rápido, pero requiere mucha experiencia y tiempo para construirlo. Además, estos modelos deben reconstruirse si cambian los datos. Las tareas de AA, como la regresión y la clasificación, se realizan en un entorno de aprendizaje supervisado.
testers-inc iptv no funciona
El aprendizaje no supervisado se lleva a cabo sin la ayuda de un supervisor. Los datos de entrada alimentados a los algoritmos ML no están etiquetados, es decir, para cada entrada no se conoce ninguna salida. El algoritmo por sí mismo descubre las tendencias y el patrón en los datos de entrada y crea una asociación entre los diferentes atributos de la entrada.
Este tipo de aprendizaje es útil para encontrar patrones en los datos, crear grupos de datos y realizar análisis en tiempo real. Tareas como la agrupación en clústeres, los algoritmos KNN, etc., se incluyen en el aprendizaje no supervisado.
Las tareas de aprendizaje semi-supervisadas aprovechan la ventaja de los algoritmos supervisados y no supervisados al predecir los resultados utilizando datos etiquetados y no etiquetados. El aprendizaje por refuerzo es un tipo de mecanismo de retroalimentación en el que la máquina aprende de la retroalimentación constante del entorno para lograr su objetivo.
En este tipo de aprendizaje, los agentes de IA realizan algunas acciones sobre los datos y el entorno da una recompensa. El aprendizaje por refuerzo se utiliza en juegos multijugador para niños, coches autónomos, etc.
¡Estén atentos a nuestro próximo tutorial para saber más sobre el aprendizaje automático y la red neuronal artificial!
=> Visite aquí para ver la serie exclusiva de aprendizaje automático
Lectura recomendada
- Minería de datos Vs Aprendizaje automático Vs Inteligencia artificial Vs Aprendizaje profundo
- Las 11 herramientas de software de aprendizaje automático más populares en 2021
- Tutorial de aprendizaje automático: introducción al aprendizaje automático y sus aplicaciones
- Tipos de datos de Python
- Tipos de datos C ++
- Tipos de riesgos en proyectos de software
- Tipos de pruebas de migración: con escenarios de prueba para cada tipo
- 15 mejores sistemas de gestión de aprendizaje (LMS del año 2021)