Sistemas computacionales: basados en conocimientos

En general podemos decir que el desarrollo de una inteligencia artificial está compuesto por los siguientes pasos

Una teoría de la inteligencia (supuestos teóricos). La representación (modelos generales) del razonamiento inteligente en una computadora.

  1. Un modelo formal de la teoría (supuestos técnicos). Modelos computacionales
  2. Una implementación computacional del modelo (sistemas de IA especificas). Métodos técnicos para su realización.

Una teoría de la inteligencia: La mente se puede representar en una computadora ya que tanto la mente como la computadora son sistemas basados en el procesamiento de la información (paradigma computacional)

Un Modelo formal: Se parte de un sistema procesador de símbolos. Sistema capaz de manipular símbolos, generar nuevos símbolos, crear y modificar relaciones entre símbolos, almacenar símbolos, etc.

  • Una implementación computacional: son los métodos o técnicas de la IA que se utilizan para la representación en la computadora 

Ya habíamos visto los pasos 1 y 2. Nos queda el paso 3: la implementación computacional del modelo

La implementación del modelo no son otra cosa que sistemas computacionales (hasta la fecha IA especificas) que se aplican a la solución de problemas complejos (que requieren de cierta inteligencia)

Sistemas basados en conocimientos: Los sistemas expertos

Durante años la actividad de la Inteligencia Artificial estuvo dedicada a las investigaciones teóricas y al desarrollo de experimentos a través de programas que demostraran “actitudes inteligentes”, con estos programas se pretendía que la máquina jugara ajedrez, demostrara teoremas matemáticos, etc. No fue hasta los años 70 que surgió un nuevo enfoque en la Inteligencia Artificial “los Sistemas Expertos”, cuya función es desarrollar trabajos similares a los que desarrollaría un especialista en un área determinada (IA especifica).

IA específica:

El objetivo original del campo de IA ha sido la construcción de “máquinas inteligentes”, es decir, los sistemas informáticos con inteligencia similar a la humana.  Desde hace décadas la mayoría de los investigadores de la IA se han centrado en lo que se ha llamado “la IA específica o estrecha”; la producción de sistemas de IA que muestran la inteligencia respecto a las tareas específicas, limitadas a un dominio de aplicación.  Debido a las dificultades en la solución de problemas complejos, en los últimos años, cada vez más los investigadores han reconocido la necesidad -y la viabilidad- de volver a los objetivos originales de la IA mediante el tratamiento de la inteligencia en su conjunto y a la necesidad de hacer frente a los problemas más difíciles de la “inteligencia de nivel humano” y más ampliamente a la inteligencia artificial general.

Los sistemas expertos (SE), son en lo esencial sistemas de computación basados en conocimientos (de ahí que algunos prefieran llamarles sistemas basados en conocimientos) cuyos componentes representan un enfoque cualitativo de la programación, ya que lo que prima no es la cantidad si no la cualidad del mismo, esta cualidad está dada por la separación de las reglas que describen el problema (Base de Conocimientos), del programa de control que es quien selecciona las reglas adecuadas (Motor de inferencias).

Podemos decir que un SE está compuesto por una base de hechos (descripción del problema), una base de conocimiento (donde se almacenan los conocimientos del experto), una máquina de inferencias, algoritmo que procesa los conocimientos (normalmente en forma de reglas) y obtiene la solución del problema casi  siempre con la explicación de los resultados y en muchos casos se incluyen en la bases de conocimientos (nuevas reglas) como una forma de aprendizaje.

La Base de Conocimientos (BC): es el conjunto de reglas que permiten representar los conocimientos del dominio de experto, donde cada regla aisladamente tiene significado propio. Normalmente los conocimientos son de tipo declarativo por lo cual la BC casi siempre es una descripción de los conocimientos del experto y requiere de algún mecanismo que obtenga las inferencias adecuadas para resolver el problema, alguien que seleccione las reglas y las vaya ejecutando, ese alguien es el motor de inferencias

El Motor de Inferencias (MI): es un programa de control cuya función es seleccionar las reglas posibles a satisfacer el problema, para ello se vale de ciertas estrategias de control sistemáticas o heurísticas. La estrategia de control consiste en un programa basado en algoritmos de búsqueda de propósito general cuya función es una exploración exhaustiva y metódica de la base de conocimientos.

La Base de Hechos (BH), también conocida como memoria de trabajo o base de datos global, es la que contiene los datos de partida y los criterios de parada, la misma se va actualizando durante la ejecución del sistema.

Además de los componentes anteriores los SE necesitan interactuar con el usuario y con el experto.

Interface con el usuario (módulo de interacción con el usuarios): es la que facilita el diálogo con el usuario, permite hacerle preguntas al sistema e incluso obtener conocimientos análogos a los del experto.  Esta interface podría ser programas de entrada/salida de forma dialogada de las explicaciones pueden ser obtenidas de la base de hechos donde se almacenan los pasos para llegar a la solución.

Interface con el experto (módulo de ayuda para la adquisición de conocimientos): permite al experto consultar los conocimientos almacenados en la base de conocimientos y en muchos casos da la posibilidad de incluirle nuevos conocimientos. Su objetivo es que el experto pueda introducir directamente sus conocimientos en la máquina sin necesidad de ver al ingeniero que desarrolló el sistema.

Los SE fueron la  aplicación dominante en los primeros años de la IA, algunas de las aplicaciones más importantes se remontan al sistema Mycin, el cual dio lugar a la mayoría de las aplicaciones en medicina y fue pionero en el tratamiento de la incertidumbre, que sirvió de patrón a los motores de inferencia de propósitos general (Shell); otro de los destacados fue Dendral cuya aplicación fue usada en la química, la prospección geológica entre otras muchas aplicaciones.

Los sistemas expertos que posteriormente fueron bautizados como sistemas basados en conocimientos y actualmente, bajo la influencia de IBM, se les llama sistemas cognitivos, siendo Watson su mayor representante, están teniendo un nuevo renacimiento y todo indica una nueva era para inteligencia artificial en general y en particular para los sistemas basados en conocimientos.

Definiendo la inteligencia artificial

intelligent-robot

En el articulo ¿Qué es la inteligencia artificial? : Desde que nació la inteligencia artificial en Dartmouth en el año 1956 hasta la fecha, todo parece ser que aun, la criatura, no cuenta con una definición exacta y a pesar de sus más de 64 años cumplidos, se sigue discutiendo que es la inteligencia artificial. Lo cual corrobora el propio estudio cien años de inteligencia artificial (AI100) cuando afirma: “Una imagen precisa y sofisticada de IA, una que compite con su popular representación: se ve obstaculizada al principio por la dificultad de precisar una definición de inteligencia artificial”.

La Unesco en su estudio preliminar sobre un posible instrumento normativo relativo a la ética de la inteligencia artificial divide la inteligencia artificial (IA) en teórica y pragmática qa lo que dice: A pesar de la multitud y diversidad de definiciones de IA, existe cierto consenso, al nivel más general, respecto a que sus dos aspectos pueden distinguirse: uno etiquetado habitualmente como “teórico” o “científico”, y el otro como “pragmático” o “tecnológico”. Y a continuación se define lo que es una IA teórica y una IA pragmática:
Hablar de IA “teórica” o “científica” es aludir al “uso de conceptos y modelos de IA para ayudar a responder preguntas sobre los seres humanos y otras cosas vivas” (Boden, 2016). Se interconecta con la ciencia cognitiva y se pregunta: ¿Es posible crear una “IA fuerte?”

Mientras la IA “pragmática” o “tecnológica” se orienta a la ingeniería. Se basa en diversas ramas: el procesamiento del lenguaje natural, la representación del conocimiento, el razonamiento automatizado, el aprendizaje automático, el aprendizaje profundo, la visión informática y la robótica (Russell y Norvig, 2016)
Y aunque se han escrito muchos libros sobre inteligencia artificial (IA) aun los especialistas no se ponen de acuerdo. Para buscar un acercamiento a lo que es la IA partiremos del paradigmático libro escrito por Stuart J. Russell y Peter Norvig: “Inteligencia artificial, un enfoque moderno”

Russell y Norvig no se comprometen con un definición única proponen un acercamiento a la IA desde cuatro enfoques, debemos aclarar que ambos están comprometidos con una IA pragmática, por lo que el libro está más enfocado al accionar de los sistemas como agentes inteligentes y de ahí su carácter moderno.
Sistemas que piensan como humanos. “El esfuerzo de hacer que las computadoras piensen… Máquinas con mente, en sentido literal” (Haugeland, 1985). Enfoque centrado en los humanos

Sistemas que actúan como humanos. “El arte de desarrollar máquinas con capacidad para realizar funciones que cuando son realizadas por personas requieren de inteligencia” (Kurzweil, 1990). Enfoque centrado en la conducta humana
Sistemas que piensan racionalmente. “El estudio de las facultades mentales, mediante el uso de modelos computacionales” (Charniak y McDermott, 1985). Enfoque centrado en la racionalidad

Sistemas que actúan racionalmente. “La inteligencia computacional en el estudio del diseño de agentes inteligentes” (Poole, 1998). Enfoque centrado en la conducta racional
Teniendo en cuenta la versatilidad de la inteligencia humana se puede clasificar la IA en general o especifica

IA general. Multitarea, capaz de resolver cualquier problema por difícil que sea. Alcanza niveles de solución similares a la mente humana (objetivo aun no alcanzado)
IA especifica. Solo resuelve problemas determinados por un dominio de aplicación (ej. Los sistemas expertos)

El español, López Mantaras, siguiendo la línea de una IA general propone la siguiente interpretación: “El objetivo último de la IA es lograr una máquina que tenga una inteligencia general similar a la del humano”.

Observen que siempre se habla de una inteligencia que piensen como humanos, que actúen como humanos, o de forma similar a la mente humana. Por lo que se afirma que cualquier sistema de IA, de alguna forma, debe tener como patrón la medida humana. Ya sea de forma directa o indirecta

Al respecto el estudio AI100, dice lo siguiente: “En particular, la caracterización de la inteligencia como espectro no otorga un estatus especial al cerebro humano, pero hasta la fecha, la inteligencia humana no tiene rival en lo biológico y mundos artificiales para su gran versatilidad… Esto hace que la inteligencia humana sea una opción natural para evaluar el progreso de la IA”.

Siguiendo la medida humana

Partiendo de la medida humana en la IA han surgido una serie de definiciones complementarias sobre la inteligencia artificial. Tal vez la definición complementaria más importante sea el de una IA fuerte y un IA débil.

Inteligencia artificial fuerte

Sostiene que todas las operaciones mentales son manifestaciones sofisticadas de complicados procesos computacionales, y que es irrelevante si tales procesos son llevados a cabo por un sujeto humano, un objeto físico o un dispositivo electrónico. Los defensores de la IA fuerte están convencidos de que se podrán reproducir todas las capacidades humanas, incluyendo la consciencia en una máquina y asume que el pensamiento racional no es otra cosa que un sistema que procesa información por tanto existe una equivalencia entre procesos mentales y algoritmos y entre las funciones del cerebro y el hardware de la máquina.

IA débil

Busca simular la inteligencia humana por medio de modelos computacionales que sean capaces de resolver actividades consideradas inteligentes y aunque aceptan que puedan haber similitudes entre programas y estados mentales no asumen una equivalencia entre ellos ni que las máquinas puedan tener conciencia, al menos no como los humanos.

Otras definiciones

Inteligencia artificial humana e inteligencia artificial ajena

Inteligencia artificial humana utiliza una definición muy parecida a la IA fuerte, en realidad la IA humana y la IA fuerte se confunden y es muy difícil delimitarlas. Podemos decir, que en principio la IA humana no se basa en reducir la medida humana a la medida computacional partiendo de que ambos son sistemas que procesan información (IA fuerte) sino que se trata de seguir la medida humana adaptándola a condiciones mecánicas. Se acepta que la mente aunque tiene características propias, se puede reproducir en otro sustrato.
En la IA ajena se abandona la medida humana por la medida computacional. O sea, se puede lograr un sistema con una inteligencia igual al humano con algoritmos computacionales sin imitar a la forma de razonar humana.

El procesamiento de la información

Son muchos los que consideran que los humanos y las computadoras son dos especies de un mismo género: los sistemas de procesamiento de la información. Aceptar a la mente humana como una forma de procesamiento de la información trae como consecuencia que se produzcan dos fenómenos inversos:
La generalización de los sistemas procesadores de información.
La simplificación de la mente humana (reduccionismo).

El reduccionismo afirma que se pueden explicar los fenómenos reduciéndolos a un nivel más elemental. Por ejemplo: la conducta humana puede reducirse a estudios neurofisiológicos (incluso sobre animales), el estudio del cerebro puede reducirse a la biología celular, etc. La IA es reduccionista, ya que trata de reducir los procesos de la mente (que son complejos) a sencillos procesamientos de la información. Siguiendo la metáfora del computador, la mente es un sistema de procesamiento de la información que cumple con las leyes de la manipulación de símbolos.

Hoy se aspira a desarrollar una IA general compuesta por varias IA especificas (que resuelven una tarea) y la IA general cuenta con una interfaz que ante un problema es capaz de seleccionar cual de las IA especificas los puede resolver por lo que a los efectos seria una IA multitarea. También cada IA específica podría ser vista como un agente que funciona dentro de un sistema multiagente y estos se combinan para resolver cualquier problema. Por lo que los agentes serian capaces de resolver una tarea pero como sistemas multiagentes pueden resolver cualquier tarea como una IA general. Al final todo depende de la potencia del hardware y de agentes inteligentes que funcionan como IA especifica, incluso, cada agente puede responder a un modelo de computación diferente.
Mas que saber que es la IA debiéramos comprender que es el ser humano.

En las definiciones de la IA se ha olvidado al sujeto que la construye: sus expectativas, deseos y esperanzas. Estamos hablando del sentido que le da cada científico a su creación, no olviden que se aspira a construir una inteligencia igual o superior a la propia. Quizás el proyecto más ambicioso que se ha propuesto jamás el ser humano.

Por lo que deberíamos entender las preguntas que se esconden detrás de cada deseo de construir una IA
Si las máquinas llegaran a pensar igual que los humanos (IA humana)
Si el pensamiento humano es solo procesamiento de información (IA fuerte)
Si solo podrán simular el pensamiento humano (IA débil)
Si las máquinas igualaran o superaran la forma de pensar humana sin la necesidad de imitarla (IA ajena)

Pero estas preguntas ignoran la relación que se está produciendo entre humanos y computadoras y es que el problema no es que las máquinas lleguen a pensar y a tener conciencia sino que estén consciente de los humanos y de su fragilidad como especie, estamos hablando de una IA que tenga en cuenta al ser humano (IA centrada en el ser humano), pero la realidad es otra, la inteligencia artificial se orienta cada vez más a una IA centrada en los algoritmos y las grandes bases de datos con el fin (muy loable) de producir riquezas; pero cada vez más ajena a la complejidad del ser humano

Agentes basados en el modelo simbólico

riesgos-ia

En la publicación anterior Agentes inteligentes  únicos, decíamos: Las arquitecturas deliberativas siguen la corriente de la IA simbólica, que se basa en la hipótesis enunciada por Newell y Simons, según la cual un sistema de símbolos físicos capaz de manipular estructuras simbólicas puede exhibir una conducta inteligente. Para ello es necesario describir los objetivos y medios de satisfacerlo, y como realizar la traducción del nivel de conocimiento al nivel simbólico.

Sigue leyendo