Sistemas de inteligencia artificial que aprenden. Redes neuronales

agente8

Hoy en día el enfoque más prometedor parece ser en de las redes neuronales, el cual está siendo adoptado actualmente por Google, en su aspiración de crear una inteligencia artificial. No es un secreto que la fortaleza de Google consiste en que utiliza las búsquedas de los millones de usuarios para aprender de ellos.

Las redes neuronales a diferencia de los sistemas simbolistas donde era necesario describir todo el conocimiento humano en forma de reglas, lo cual obligaba a tener en cuenta toda la experiencia humana, tarea imposible. Como, bien, dice Varela: en el enfoque conexionista, el sentido no está localizado en símbolos particulares, sino que opera en función del estado global del sistema y está relacionado con el desempeño general en un área determinada. Como el reconocimiento o el aprendizaje

Hoy son muchos los investigadores que consideran, que por su capacidad de aprendizaje, las neuronas de los organismos biológicos se han estudiado para su aplicación en sistemas de aprendizaje automático, basándose en lo que ya se sabía entonces sobre el reforzamiento de las sinapsis entre neuronas biológicas, se vio que estas redes neuronales artificiales se podían entrenar para aprender funciones que relacionaran las entradas con las salidas mediante el ajuste de los pesos que sirven para ponderar las conexiones entre neuronas, por este motivo se pensó que serían mejores modelos para el aprendizaje, la cognición y la memoria, que los modelos basados en la IA simbólica.

¿Qué son las redes neuronales?

Una red neuronal artificial (RNA) es un sistema de procesamiento de información que tiene ciertas aptitudes en común con las redes neuronales biológicas. Donde el procesamiento de información ocurre en muchos elementos simples llamados neuronas y no son otra cosa que un modelo artificial y simplificado del cerebro humano y actualmente, es el ejemplo más perfecto del que disponemos para un sistema que es capaz de adquirir conocimiento a través de la experiencia.

Definiciones de una red neuronal.

Existen numerosas formas de definir a las redes neuronales; desde las definiciones cortas y genéricas hasta las que intentan explicar más detalladamente qué son las redes neuronales. Por ejemplo:

Una nueva forma de computación, inspirada en modelos biológicos (bioinspirada).
Un modelo matemático compuesto por un gran número de elementos procesales organizados en niveles.
Un sistema de computación compuesto por un gran número de elementos simples, elementos de procesos muy interconectados, los cuales procesan información por medio de su estado dinámico como respuesta a entradas externas.
Redes neuronales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organización jerárquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biológico.

Para la clasificación de las RNA veremos dos enfoques diferentes: uno que tiene cierta similitud con la realidad biológica y otro basado en las matemáticas y en las posibilidades actuales de la computadora:

Enfoque neuronal (inspirado en las redes neuronales biológicas): comprende las redes que tratan de simular los sistemas neuronales biológicos. Supone que tiene una estructura de neuronas interconectadas que se estimulan unas a otras, las cuales pueden ser “entrenadas” para dar una cierta respuesta cuando se le presentan determinados valores (modelo conexionista).

Enfoque computacional (Reconocimiento Lógico Combinatorio de Patrones). No tiene por qué guardar similitud con los sistemas biológicos: Su arquitectura está fuertemente ligada a las necesidades de las aplicaciones para la que es diseñada: aprendizaje inductivo y reconocimiento de patrones. Se basa en la idea de que la modelación del problema debe ser lo más cercana posible a la realidad del mismo, sin hacer suposiciones que no estén fundamentadas (modelo basado en datos).

Aquí nos concentraremos en el enfoque bioinspirado, por lo que asumimos que las redes neuronales permiten crear un núcleo de conexiones y que sobre su propia experiencia puedan ir ampliándose, similar a como funciona el cerebro. Siguiendo este enfoque, algunos investigadores ven la representación neuronal como una metáfora del cerebro que asume que el funcionamiento de las neuronas puede ser representado (modelado) computacionalmente y que se comportan igual que el cerebro, las neuronas artificiales son iguales a las neuronas naturales. Y consideran a las redes neuronales artificiales (RNA) como una representación genuina del funcionamiento del cerebro, por lo que se mantiene la metáfora del computador, pero ahora se traslada al cerebro.

Emergencia y auto organización

Las investigaciones en las redes neuronales han estado inmersas en la creación de autómatas que aprendan a descubrir relaciones ocultas en los datos a la vez que puedan codificar y almacenar información en forma similar a como lo realiza el cerebro. La neuro computación utiliza como base la metáfora cerebral, pero no persigue como objetivo la construcción de máquinas absolutamente plausibles biológicamente, sino el desarrollo de máquinas útiles. La capacidad intelectual depende de la acción colectiva de las neuronas, que realizan procesos en serie y en paralelo utilizando la retroalimentación y una organización molecular y laminar con alta capacidad de auto-organización y cooperatividad basada en una estructura jerárquica que permite el procesamiento local y centralizado en fases

Teniendo en cuenta a Varela (quien fuera un experto en ciencias cognitivas): La estrategia consiste en construir un sistema cognitivo no a partir de reglas y símbolos, sino a partir de componentes simples’ que se conecten dinámicamente entre sí de manera densa. En este enfoque, cada componente opera solo en su ámbito local, de modo que ningún agente externo hace girar el eje del sistema. Pero como el sistema está constituido como red, hay una cooperación global que emerge espontáneamente cuando los estados de todas las «neuronas» participantes alcanzan un estado mutuamente satisfactorio. En dicho sistema, pues, no se requiere una unidad procesadora central que guie la operación. Este tránsito desde las reglas locales hacia la coherencia global es el corazón de aquello que en la era cibernética se llamaba auto organización. Hoy se prefiere hablar de propiedades emergentes o globales, dinámica de red, redes no lineales, sistemas complejos e incluso sinergia.

Varela describe las dos clases principales de métodos de aprendizaje:

El primero, ilustrado por la regla de Hebb e inspirado por los mecanismos cerebrales, es el aprendizaje por correlación: se presenta al sistema una serie de ejemplos que lo condicionan para encuentros futuros… Este enfoque depende pues de introducir las conexiones apropiadas, lo cual se efectúa habitualmente mediante una norma para el cambio gradual de conexiones, a partir de un estado inicial arbitrario. La norma de aprendizaje mas explorada es la «Regla de Hebb». En 1949 Donald Hebb sugirió que el aprendizaje se podía basar en cambios cerebrales que surgen del grado de actividad correlativa entre las neuronas: si dos neuronas tienden a activarse juntas, la conexión entre ambas se fortalece; de lo contrario disminuye. Por ende, la conectividad del sistema se vuelve inseparable de su historia de transformación y se relaciona con la clase de tarea definida para el sistema.

El segundo es el aprendizaje por imitación, es decir mediante un modelo que actúa como instructor Esta es la estrategia que propone Rosenblatt en su Perceptron. En su versión moderna se la conoce como «retro propagación» (propagación retrograda). Según esta técnica, los cambios en las conexiones neuronales del interior de la red (llamadas unidades ocultas) se asignan de modo tal de reducir al mínimo la diferencia entre la reacción de la red y lo que se espera de ella. Aquí el aprendizaje se parece a alguien que intenta imitar a un instructor. NetTalk, un célebre y reciente ejemplo de este método, es un conversor grafemas-fonemas que opera a partir de ciertas páginas escritas que se le presentan en su fase de aprendizaje. Como resultado, NetTalk puede leer en voz alta un nuevo texto en lo que muchos testigos consideran una pronunciación deficiente pero comprensible (aprendizaje supervisado)

Critica a las redes neuronales artificiales

Una de las limitaciones de las RNAs es que son totalmente incapaces de explicar de una manera transparente sus procesos de razonamiento durante la toma de decisiones, tal como hacían los sistemas expertos. Son arquitecturas de caja negra.

Como indica J. Brockman, el motivo por el que las RNAs no son transparentes es que “funcionan en modo estadístico, sin atenerse a un modelo, lo cual equivale a encajar una función en una nube de puntos de datos”. Esto no debería sorprender, puesto se trata de mecanismos de procesamiento estadístico de números a partir de datos, y no entienden ningún tipo de contexto. Esto significa que no disponen de ninguna herramienta de rastreo de razonamiento causal y por lo tanto no pueden utilizarse como modelo para desarrollar una inteligencia artificial similar a la humana.

Referencia:

Varela, F., Thompson, E. Y Rosch,E. (1997) De Cuerpo presente: Las ciencias cognitivas y la experiencia humana. Gedisa, Barcelona