Imagínate que necesitamos enseñarle a una persona el significado de la palabra elefante ya que no la conoce.
Datos
Hacen referencia a la información que le ofrecemos a la persona para que pueda aprender lo que es por ejemplo, un elefante.
Esta información podría ser a través de otras palabras que le ayuden a definir el concepto de elefante.
- Podemos empezar por aportar datos que ofrecen información sobre el aspecto de un elefante:
Es un animal terrestre grande, mamífero y herbívoro, se alimenta de hojas, hierbas, corteza y tallos. Normalmente son de color grisáceo y se organizan en manadas de varios ejemplares.
- Características morfológicas.
Estos datos ofrecen información sobre las características físicas del elefante. Por ejemplo: tiene una larga trompa y enormes orejas en forma de abanico. Suelen tener colmillos de marfil.
Estos datos que ofrecen más información: Para algunas culturas asiáticas, el elefante es considerado un animal sagrado. Habitan en bosques o sabanas boscosas y pastizales. Emiten un potente sonido gracias a su larga trompa.
Toda esta información serían datos, seguro que tú podrías añadir algunos más.
Es lógico pensar que el aprendizaje mejorará en función del número de datos que aportamos. Por lo tanto, podemos decir que permiten "aprender" mejor a la Inteligencia Artificial, haciéndola cada vez más eficiente.
Algoritmo
El algoritmo está formado por el software encargado de relacionar todos los datos introducidos en la máquina y crear un modelo que de respuestas correctas.
Dicho de otra forma, los algoritmos son un conjunto de instrucciones de programa que van a permitir realizar una tarea determinada. En nuestro ejemplo, conseguirán que la "máquina" en función de los datos introducidos sea capaz de identificar la palabra relacionada con el texto.
Siguiendo con nuestro ejemplo, ¿qué pasará si la persona que acaba de aprender lo que es un elefante le enseñamos el texto: "emiten sonidos denominados barritos gracias a su larga nariz"?
La persona empezará a buscar similitudes con los datos que ya conoce: características físicas, morfológicas, otros aspectos, etc.
Seguramente llegará a la conclusión de que emitir un sonido denominado barrito es una de las características de un elefante.
En el caso de una máquina resulta que esta frase no coincide con ninguna de las introducidas como datos.
¿Qué ocurrirá en este caso? ¿Será capaz la máquina de identificar el texto?
La respuesta la encontramos en un concepto muy importante en la Inteligencia Artificial que es la generalización.
Gracias a la generalización, nuestro modelo será capaz de encontrar relaciones de coincidencia entre el nuevo texto y los que ya posee como datos. Seguramente la máquina nos dirá que se trata de un elefante.
Aprendizaje automático
El aprendizaje automático o Machine Learning es una rama de la Inteligencia Artificial que utilizando datos y algoritmos es capaz de imitar la inteligencia humana.
Continuando con nuestro ejemplo, vamos a analizar la siguiente palabra:
¿Qué pasará si a la persona que acaba de aprender lo que es un elefante le mostramos la frase: "el período de gestación de este animal es de casi 22 meses"?
Es posible que le cueste trabajo buscar una relación con los datos que acaba de aprender y no sepa decirnos de qué se trata. Cuando le digamos que se trata del período de gestación de un elefante, esta persona sabrá en un futuro identificar esta frase.
¿Qué pasará en el caso de una máquina?
En el caso de una máquina ocurrirá algo parecido.
El modelo no sabrá clasificar la frase como un elefante. En este caso deberemos introducir este texto como un nuevo dato para que lo clasifique como un elefante. El algoritmo deberá crear un nuevo modelo incorporando la información aportada por nosotros. La próxima vez que la máquina lea esta frase, el modelo nos dirá que se trata de un elefante.
Este proceso se conoce como: "Mahine Learning” o Aprendizaje automático. De forma específica, este tipo de aprendizaje automático se denomina aprendizaje supervisado, ya que se parte de un conjunto de datos que contienen ejemplos de entrenamiento con etiquetas asociadas.
El algoritmo aprende la relación entre los datos suministrados y sus etiquetas o clase de textos, aplicando esa relación para clasificar nuevos datos que la máquina no ha visto antes.