MenúInicial

Cine

TopTen
Películas
Entrevistas
Guiones
Links

Literatura

TopTen
Libros
Relatos
Enigmas
Links

IA

¿Qué es?
Nacimiento
Vertientes
Robótica
Sist. Expertos
Neurocomput.
Links

La Web

 




VI.Minsky y Papert: comienza la etapa oscura
Cuando la investigación sobre redes neuronalesse ofrecía ta prometedora, Minsky y Papert publicaron un trabajoque sumiría esta línea de investigación poco menosque en el conjunto de las proscritas durante un período de veinteaños, ya que demostraron muchas de las limitaciones del perceptrón.Entre estas limitaciones se encontraba la de no ser capaz de aprender unaoperación lógica tan básica como el Or-exclusivoo XOR, que da la casualidad de que es el operador de comparación.Así pues, un perceptrón no era capaz de indicar si sus entradaseran iguales o distintas.
Como se ha indicado, un perceptrón esuna red neuronal de una única neurona. Por tanto, su funciónde salida se corresponderá con la de la fórmula 1 del capítuloII. Ahora bien, dado que la salida del perceptrón es binaria, odevuelve el valor de activación o devuelve el valor nulo. Por tanto,está claro que divide el espacio muestral de vectores de entradaen dos regiones. si el perceptrón tiene dos entradas, el vectorde entrada tendrá dimensión dos, por tanto, todas las entradasse pueden representar como puntos en un plano, considerando la primeraentrada como coordenada x y la segunda como coordenada y. La funciónde salida del perceptrón será:

1 si w1*y1 + w2*y2 - u > 0
0 si w1*y1 + w2*y2 -u <= 0

y la ecuación de la línea límiteentre las dos regiones, con salida 0 y con salida 1, será, precisamente,

w1*y1 + w2*y2 - u = 0

la ecuación de una recta en el plano.Si el perceptrón tiene tres entradas, por el mismo razonamientolos vectores de entrada pueden considerarse coordenadas en el espacio yla división entre las dos regiones correspondientes a cada posiblesalida, será un plano. En general, para cualquier númerode entradas, el límite entre estas dos regiones viene determinadopor la zona de transición de la función escalón, esdecir:

que se corresponde con un hiperplano de dimensiónn-1 en un espacio vectorial de dimensión n. Esto es lo que se conocecomo condición de separabilidad lineal del espacio de entradaFigura 5(A).
Esta condición nos dice que, para queun perceptrón pueda distinguir entre dos categorías, éstasdeben ser separables linealmente o de lo contrario el perceptrónserá incapaz de aprender. Ahora bien, supóngase que se tratade entrenar un perceptrón para que clasifique entradas segúndos categorías que se corresponden con una operación lógicatan simple como un XOR. Es decir, las entradas pertenecen a una categoríasi ambas son iguales y a otra si ambas son distintas. Bien, fíjeseel lector en el problema del XOR, representado en la Figura5(B). Trate de separar las 2 categorías definidas por latabla de verdad del XOR, mediante una única linea recta: imposible.El problema surge cuando se desea emplear un perceptrón para reconocerpatrones y no se sabe, a priori, si estos son linealmente separables.


Figura 5. A) Condición de separabilidad lineal. B) El problemadel XOR.

El problema del perceptrón no era difícilde encontrar. Es fácil demostrar que si se generaliza la idea delperceptrón a un perceptrón multicapa (con una segunda capade neuronas, procesando la salida de la primera capa), es posible realizarcualquier operación lógica. El problema es que, al trabajarcon redes multicapa, no se sabe sobre los pesos de qué neurona nide qué capa recae la responsabilidad de los errores de la red. Asípues, no existía posibilidad de entrenar este tipo de redes neuronales.
En este punto se quedó la investigaciónen temas de redes neuronales a finales de los años 60. Durante unperíodo de 20 años, las instituciones apenas se atrevíana financiar ningún trabajo que girara alrededor de las mismas, yaque parecía un camino sin salida.
Sin embargo, a principios de los 80, esta disciplinaresurgió de sus cenizas. Apareció el algoritmo de retropropagación,capaz de entrenar perceptrones multicapa, y con él una pléyadede nuevas arquitecturas y algoritmos de entrenamiento basadas en diversasideas, desde la original de Rossenblatt, hasta la mecánica estadística.Y en este nuevo período de esplendor de la neurocomputación,se ha encontrado en otra disciplina de soft-computing, una de lasmejores formas de entrenar una red neuronal de cualquier grado de complejidad:el uso de algoritmos genéticos.

Fernando J. Echevarrieta (Programación Actual Nº 30)

I.La neurona biológica
II.Los orígenes: La neurona de McCulloch y Pitts
III.Aprendiendo y generalizando
IV.El perceptrón de Rossenblatt
V.Aprendizaje del perceptrón
VI.Minsky y Papert: comienza la etapa oscura