Sie sind auf Seite 1von 5

En ciencias de la computacin el aprendizaje automtico o aprendizaje de mquinas (del

ingls, "Machine Learning") es una rama de la inteligencia artificial cuyo objetivo es


desarrollar tcnicas que permitan a las computadoras aprender. De forma ms concreta,
se trata de crear programas capaces de generalizar comportamientos a partir de una
informacin no estructurada suministrada en forma de ejemplos. Es, por lo tanto, un
proceso de induccin del conocimiento. En muchas ocasiones el campo de actuacin del
aprendizaje automtico se solapa con el de la estadstica, ya que las dos disciplinas se
basan en el anlisis de datos. Sin embargo, el aprendizaje automtico se centra ms en el
estudio de la complejidad computacional de los problemas. Muchos problemas son de
clase NP-hard, por lo que gran parte de la investigacin realizada en aprendizaje
automtico est enfocada al diseo de soluciones factibles a esos problemas. El
aprendizaje automtico puede ser visto como un intento de automatizar algunas partes
delmtodo cientfico mediante mtodos matemticos.
El aprendizaje automtico tiene una amplia gama de aplicaciones, incluyendo motores de
bsqueda, diagnsticos mdicos, deteccin de fraude en el uso de tarjetas de crdito,
anlisis del mercado de valores, clasificacin de secuencias de ADN, reconocimiento del
habla y del lenguaje escrito, juegos y robtica.

Resumen
Algunos sistemas de aprendizaje automtico intentan eliminar toda necesidad de intuicin
o conocimiento experto de los procesos de anlisis de datos, mientras otros tratan de
establecer un marco de colaboracin entre el experto y la computadora. De todas formas,
la intuicin humana no puede ser reemplazada en su totalidad, ya que el diseador del
sistema ha de especificar la forma de representacin de los datos y los mtodos de
manipulacin y caracterizacin de los mismos. Sin embargo, las computadoras son
utilizadas por todo el mundo con fines tecnolgicos muy buenos.

Modelos
El aprendizaje automtico tiene como resultado un modelo para resolver una tarea dada.
Entre los modelos se distinguen1

los modelos geomtricos, construidos en el espacio de instancias y que pueden tener


una, dos o mltiples dimensiones. Si hay un borde de decisin linear entre las clases,
se dice que los datos son linearmente separables. Un lmite de decisin linear se
define como w * x = t, donde w es un vector perpendicular al lmite de decisin, x es un
punto arbitrario en el lmite de decisin y t es el umbral de la decisin

los modelos probabilsticos, que intentan determinar la distribucin de probabilidades


descriptora de la funcin que enlaza a los valores de las caractersticas con valores
determinados. Uno de los conceptos claves para desarrollar modelos probabilsticos
es la estadstica bayesiana.

los modelos lgicos, que transforman expresan las probabilidades en reglas


organizadas en forma de rboles de decisin.

Los modelos pueden tambin clasificarse como modelos de agrupamiento y modelos de


gradiente. Los primeros tratan de dividir el espacio de instancias en grupos. Los segundos,
como su nombre lo indican, representan un gradiente en el que se puede diferenciar entre
cada instancia. Clasificadores geomtricos como las mquinas de vectores de apoyo son
modelos de gradientes.

Atributos
Un atributo o caracterstica es un tipo de medida realizada sobre cualquier instancia a
medir. Los atributos mapean el espacio de instancias a un conjunto de valores o dominio
de atributos. Los valores del dominio pueden ser nmeros como la frecuencia de aparicin
de las instancias, valores binarios o un conjunto cualquiera como el de meses, estaciones
o colores.

Tipos de algoritmos

Una mquina de vectores de soporte

Los diferentes algoritmos de Aprendizaje Automtico se agrupan en una taxonoma en


funcin de la salida de los mismos. Algunos tipos de algoritmos son:
Aprendizaje supervisado
El algoritmo produce una funcin que establece una correspondencia entre las
entradas y las salidas deseadas del sistema. Un ejemplo de este tipo de algoritmo
es el problema de clasificacin, donde el sistema de aprendizaje trata de etiquetar
(clasificar) una serie de vectores utilizando una entre varias categoras (clases). La
base de conocimiento del sistema est formada por ejemplos de etiquetados
anteriores. Este tipo de aprendizaje puede llegar a ser muy til en problemas de
investigacin biolgica, biologa computacional y bioinformtica.
Aprendizaje no supervisado
Todo el proceso de modelado se lleva a cabo sobre un conjunto de ejemplos
formado tan slo por entradas al sistema. No se tiene informacin sobre las
categoras de esos ejemplos. Por lo tanto, en este caso, el sistema tiene que ser
capaz de reconocer patrones para poder etiquetar las nuevas entradas.

Aprendizaje semisupervisado
Este tipo de algoritmos combinan los dos algoritmos anteriores para poder
clasificar de manera adecuada. Se tiene en cuenta los datos marcados y los no
marcados.
Aprendizaje por refuerzo
El algoritmo aprende observando el mundo que le rodea. Su informacin de
entrada es el feedback o retroalimentacin que obtiene del mundo exterior como
respuesta a sus acciones. Por lo tanto, el sistema aprende a base de ensayo-error.
Transduccin
Similar al aprendizaje supervisado, pero no construye de forma explcita una
funcin. Trata de predecir las categoras de los futuros ejemplos basndose en los
ejemplos de entrada, sus respectivas categoras y los ejemplos nuevos al sistema.
Aprendizaje multi-tarea
Mtodos de aprendizaje que usan conocimiento previamente aprendido por el
sistema de cara a enfrentarse a problemas parecidos a los ya vistos.
El anlisis computacional y de rendimiento de los algoritmos de
aprendizaje automtico es una rama de la estadstica conocida
como teora computacional del aprendizaje.
El aprendizaje automtico las personas lo llevamos a cabo de
manera automtica ya que es un proceso tan sencillo para
nosotros que ni nos damos cuenta de cmo se realiza y todo lo
que implica. Desde que nacemos hasta que morimos los seres
humanos llevamos a cabo diferentes procesos, entre ellos
encontramos el de aprendizaje por medio del cual adquirimos
conocimientos, desarrollamos habilidades para analizar y evaluar
a travs de mtodos y tcnicas as como tambin por medio de la
experiencia propia. Sin embargo, a las mquinas hay que
indicarles cmo aprender, ya que si no se logra que una mquina
sea capaz de desarrollar sus habilidades, el proceso de
aprendizaje no se estar llevando a cabo, sino que solo ser una
secuencia repetitiva. Tambin debemos tener en cuenta que el
tener conocimiento o el hecho de realizar bien el proceso de
aprendizaje automtico no implica que se sepa utilizar, es preciso
saber aplicarlo en las actividades cotidianas, y un buen
aprendizaje tambin implica saber cmo y cundo utilizar nuestros
conocimientos.
Para llevar a cabo un buen aprendizaje es necesario considerar
todos los factores que a este le rodean, como la sociedad, la
economa, la ciudad, el ambiente, el lugar, etc. Por lo tanto, es
necesario empezar a tomar diversas medidas para lograr un

aprendizaje adecuado, y obtener una automatizacin adecuada


del aprendizaje. As, lo primero que se debe tener en cuenta es el
concepto de conocimiento, que es el entendimiento de un
determinado tema o materia en el cual tu puedas dar tu opinin o
punto de vista, as como responder a ciertas interrogantes que
puedan surgir de dicho tema o materia.

Enfoques
rboles de decisiones
Este tipo de aprendizaje usa un rbol de decisiones como modelo
predictivo. Se mapean observaciones sobre un objeto con
conclusiones sobre el valor final de dicho objeto.
Los rboles son estructuras bsicas en la informtica. Los rboles
de atributos son la base de las decisiones. Una de las dos formas
principales de rboles de decisiones es la desarrollada
por Quinlan de medir la impureza de la entropa en cada rama,
algo que primero desarroll en el algoritmo ID3 y luego en el C4.5.
Otra de las estrategias se basa en el ndice GINI y fue
desarrollada por Breiman, Friedman et alia. El algoritmo de CART
es una implementacin de esta estrategia.2

Reglas de asociacin
Los algoritmo de reglas de asociacin procuran descubrir
relaciones interesantes entre variables. Entre los mtodos ms
conocidos se hallan el algoritmo a priori, el algoritmo Eclat y el
algoritmo de Patrn Frecuente.

Algoritmos genticos
Los algoritmos genticos son procesos de bsqueda heurstica
que simulan la seleccin natural. Usan mtodos tales como la
mutacin y el cruzamiento para generar nuevas clases que
puedan ofrecer una buena solucin a un problema dado.

Redes neurales artificiales


Las redes de neuronas artificiales (RNA) son un paradigma de
aprendizaje automtico inspirado en las neuronas de los sistemas
nerviosos de los animales. Se trata de un sistema de enlaces de
neuronas que colaboran entre s para producir un estmulo de
salida. Las conexiones tienen pesos numricos que se adaptan
segn la experiencia. De esta manera, las redes neurales se

adaptan a un impulso y son capaces de aprender. La importancia


de las redes neurales cay durante un tiempo con el desarrollo de
los vectores de soporte y clasificadores lineales, pero volvi a
surgir a finales de la dcada de 2000 con la llegana
del aprendizaje profundo.

Mquinas de vectores de soporte[editar]


Artculo principal: Mquinas de vectores de soporte

Las MVS son una serie de mtodos de aprendizaje supervisado


usados para clasificacin y regresin. Los algoritmos de MVS
usan un conjunto de ejemplos de entrenamiento clasificado en
dos categoras para construir un modelo que prediga si un nuevo
ejemplo pertenece a una u otra de dichas categoras.

Algoritmos de agrupamiento
Artculo principal: Algoritmo de agrupamiento

El anlisis por agrupamieto (clustering en ingls) es la


clasificacin de observaciones en subgrupos - clusters - para que
las observaciones en cada grupo se asemejen entre s segn
ciertos criterios.
Las tcnicas de agrupamiento hacen inferencias diferentes sobre
la estructura de los datos; se guan usualmente por una medida
de similaridad especfica y por un nivel de compactamiento interno
(similarida entre los miembros de un grupo) y la separacin entre
los diferentes grupos.
El agrupamiento es un mtodo de aprendizaje no supervisado y
es una tcnica muy popular de anlisis estadstico de datos.

Redes bayesianas
Artculo principal: Redes bayesianas

Una red bayesiana, red de creencia o modelo acclico dirigido es


un modelo probabilstico que representa una serie de variables de
azar y sus independencias condicionales a travs de un grfo
acclico dirigido. Una red bayesiana puede representar, por
ejempo, las relaciones probabilsticas entre enfermedades y
sntomas. Dados ciertos sntomas, la red puede usarse para
calcular las probabilidades de que ciertas enfermedades estn
presentes en un organismo. Hay algoritmos eficientes que infieren
y aprenden usando este tipo de representacin.

Das könnte Ihnen auch gefallen