Unidad II Introducción a los sistemas inteligentes.
2.1 Conceptos sobre inteligencia máquina (CI.Máquina).
Al tratar de duplicar algunas de las funciones inteligentes humanas en las máquinas, se ha dado origen a las llamadas máquinas o sistemas inteligentes.
De estas máquinas, las mas notables son las computadoras. Pero hay muchas otras clases de máquinas que se comportan apropiadamente en respuesta a varias señales y que también son llamadas máquinas inteligentes.
Los avances de las tecnologías de Hardware y de Software han mejorado la eficacia de los sistemas inteligentes, resultando en decisiones ‘’casi humanas’’, mejoras en la calidad de ejecución y en la robustez en la percepción, a velocidades y tolerancias sobrehumanas.
Las nuevas tecnologías de Hardware incluyen:
1.- Procesadores Masivamente Paralelos.
2.- Implementaciones Especiales de Alta Velocidad de Sistemas Cognoscitivos Difusos.
3.- Conceptos innovativos de procesadores asociativos que accesan datos directamente sin búsqueda.
4.- Aceleradores celulares para computadoras personales.
Las nuevas tecnologías en Software incluyen:
1.- Redes Neurales Holográficas Avanzadas, Invariantes, de Alto Orden.
2.- Sistemas Expertos Difusos.
3.- Memorias Holográficas de Contenido Difuso Direccionable.
4.- Paquetes de Razonamiento Difuso, Toma de Decisiones y Control.
5.- Métodos de Programación para Visión Asociativa y Procesadores Celulares.
6.- Ambientes de Software Orientados a Objetos.
7.- Herramientas de aplicación adaptativas Orientas a Usuarios.
Los sistemas inteligentes están diseñados para tratar con problemas altamente variantes, complejos, ruidosos, y confusos en:
1.- Administración.
2.- Finanzas.
3.- Manufactura.
4.- Reconocimiento de Formas.
5.- Instrumentación Adaptativa.
6.- Procesos de control.
7.- Robótica.
8.- Diagnostico.
9.- Bases de Datos Inteligentes.
10.- Máquinas Diccionario, etc.
En las décadas pasadas, la inteligencia hecha por el hombre fue canalizada por dos caminos, la inteligencia artificial simbólica(sistemas expertos) y redes neurales(sistemas de aprendizaje adaptativo). Estas dos tendencias en conjunto con el razonamiento difuso han dado paso a grandes avances en las siguientes áreas cruciales.
1.- Procesamiento de información(Soft): Aprendizaje Rápido, Asociaciones Difusas, Razonamiento y Control Difuso, Generalización.
2.- Procesamiento de Información Masivamente en Paralelo: Hardware Concurrente, Paralelo, Asociativo, y Celular.
Las técnicas aplicadas en los sistemas inteligentes conducen en la elección de sistemas de razonamiento cuyo comportamiento emula el de la mente humana. Los sistemas deben de ser capaces de describir, evaluar y aproximar información con algún grado de difusión, incertidumbre o incompletez. La meta última es hacer el procesamiento de información intuitivo que muestran los humanos:
1.- Razonamiento Inconsciente, Análogo, Paralelo y Distribuido.
2.- Reconocimiento de Patrones.
3.- Razonamiento Probabilístico.
4.- Razonamiento Inductivo en situaciones de información difusa o incompleta.
Los desarrollos recientes en el diseño y adaptación de los sistemas inteligentes, han proporcionado avances mayores en las siguientes áreas:
1.- Modelos biológicos; computadoras neurales y masivamente paralelas.
2.- Computación concurrente; sistemas inteligentes en tiempo real.
3.- Integración de Razonamiento, Información y Servicio.
4.- Aprendizaje Rápido y Reconocimiento Invariante de Objetos.
5.- Programación dinámica, genética y caótica.
2.1.2. Modelando la Inteligencia
La inteligencia natural es abundante en todos los ámbitos de la naturaleza. Las redes neurales extraen sus principios de las ciencias del cerebro para modelar reconocimiento, aprendizaje, y procesos de planeación. La lógica difusa refleja muy cercanamente la manera en que razonamos los humanos con reglas aproximadas. Los algoritmos genéticos aprovechan directamente los conocimientos obtenidos a través de la investigación en genética, modelando los principios de Darwin de selección natural. Los Fractales asemejan vagamente la manera en que los sistemas vivientes repiten patrones mientras crecen. La teoría del caos usa mecanismos derivados de simulaciones matemáticas de procesos que nunca son exactamente los mismos dos veces. Los autómatas celulares modelan un universo de dos dimensiones de células vivientes y un conjunto simple de modos de interacción. Y la lista sigue.
La familia de métodos emergentes de solución de problemas que imitan la inteligencia forma parte de la computación cognoscitiva. La computación cognoscitiva substituye con técnicas de procesamiento mas inteligentes, las técnicas de programación tradicionales, largas y complejas. Estos modelos inteligentes se pueden aplicar a una gama mas amplia de situaciones ya que no tienen limitaciones, por ejemplo, a ser lineales.
Una desventaja de las técnicas de computación cognoscitiva es que, frecuentemente, no se puede probar su estabilidad de otra manera que con pruebas de campo extensivas. Las pruebas analíticas tradicionales son imposibles de obtener para un enfoque donde no se usa metodología analítica o no se sigue un modelo matemático.
Las tres tecnologías principales de la computación cognoscitiva son:
1.- Tecnologías Difusas (fuzzy).
2.- Tecnologías Neurales.
3.- Tecnologías Genéticas.
Las tres derivan su generalidad de la interpolación de soluciones a problemas desconocidos a partir de las soluciones a problemas que les son familiares.
2.1.3. La Inteligencia en las Máquinas y Sistemas
Zadeh establece que el año 1990 debe ser visto como el comienzo de una nueva tendencia de el diseño de aparatos caseros, electrónicos de consumo, cámaras, y otros tipos de productos de alto consumo. Menciona que esa tendencia se relaciona con un incremento marcado en lo que el ha bautizado como el cociente intelectual de las máquinas (MIQ) de tales productos comparado con el que tenían antes de 1990. Ahora se tienen hornos de microondas y lavadoras que pueden figurarse sus condiciones de proceso para realizar sus tareas óptimamente, y muchos otros productos que manifiestan una capacidad impresionante de razonamiento, tomar decisiones inteligentes, y aprender de la experiencia.
La explotación de la tolerancia a la imprecisión y la incertidumbre soporta la habilidad humana de entender habla distorsionada, descifrar escritura manuscrita, comprender lenguaje natural, sumarizar texto, reconocer y clasificar imágenes, manejar vehículos en trafico denso, y mas generalmente, hacer decisiones racionales en un ambiente de imprecisión e incertidumbre. La computación cognoscitiva, que Zadeh llama computación suave (Soft Computing) usa la mente humana como modelo y al mismo tiempo, apunta a la formalización de los procesos cognoscitivos que los humanos usamos en la realización de las tareas diarias.
Las aplicaciones industriales de la lógica difusa empezaron a principios de los 80’s con el control para plantas de cemento y el metro de Sendai diseñado por Hitachi, y sentaron las bases para el uso de la lógica difusa en el diseño y producción de productos de consumo con alto MIQ.
El primer producto fue una regadera de baño controlada con lógica difusa producida por Matsushita en 1987. Esta fue seguida por la primer lavadora controlada por lógica difusa, en 1989. En 1990 comenzó el crecimiento en el número de productos de consumo con alto MIQ. Poco después se comenzaron a emplear técnicas de redes neurales combinadas con lógica difusa en una gran variedad de productos de consumo, dotando a tales productos con la capacidad de adaptarse y aprender de la experiencia.
Los constituyentes principales de la computación suave, de acuerdo a Zadeh, son:
1.- Lógica Difusa(FL).
2.- Teoría de Redes Neurales(NN).
3.- Razonamiento Probabilístico(PR).
Este ultimo (PR) incluye redes de creencias, algoritmos genéticos, partes de la teoría de aprendizaje, y sistemas caóticos. La lógica difusa (FL) esta relacionada con la imprecisión, las redes neurales con el aprendizaje, y el razonamiento probabilístico con la incertidumbre. Y en general se puede decir que estas tres técnicas diferentes son complementarias en lugar de competitivas. Por esta razón, ha resultado ventajoso el empleo de FL, NN,PR en combinación, en lugar de usar alguno exclusivamente en el diseño e implementación de sistemas inteligentes.
El concepto de sistema inteligente ya no se aplica solamente a las computadoras, sino que su ámbito abarca un número creciente de aplicaciones que van desde los sistemas de control difusos, hasta los modelos que emulan sistemas complejos como los económicos, políticos, sociales etc., pasando por los edificios inteligentes, carreteras inteligentes y muchos otros mas.
Con el advenimiento de las computadoras digitales, se creó toda una ciencia para el manejo de información mediante secuencias de ceros y unos. Esta forma de representación utiliza la lógica binaria como base para el almacenamiento y recuperación de información.
Para el manejo del conocimiento se utiliza un lenguaje simbólico. Estos símbolos se combinan mediante reglas y a partir de éstas pueden modelarse sistemas complejos. Por ejemplo, los sistemas expertos en inteligencia artificial. La principal desventaja de esta representación del conocimiento es que se necesitan demasiadas reglas para poder representar fielmente un sistema del mundo real. Básicamente porque hay una relación de uno a uno. Es decir, para un caso particular del sistema del mundo debe existir una regla en el sistema experto.
La representación del conocimiento mediante lógica difusa permite disminuir drásticamente el número de reglas que se necesitan para modelar un sistema. Mediante este enfoque, una regla difusa cubre varios casos dentro del sistema del mundo real.
2.3. Áreas de la inteligencia artificial.
La mayoría de las técnicas en el área de la inteligencia artificial caen muy lejos de competir con seres humanos o incluso animales. Los sistemas para computadora diseñados para ver imágenes, oir sonidos y entender el lenguaje sólo pueden obtener un éxito limitado. Sin embargo, en un área de la inteligencia artificial - aquella que razona con el conocimiento en un dominio limitado - los programas pueden no sólo aproximarse a la forma de actual humana, si no que a veces lo superan.
Estos programas emplean un conjunto de hechos, reglas y otros tipos de conocimientos de un campo determinado, así como de métodos para aplicar las reglas para hacer inferencias. Resuelven problemas en campos tan especializados como diagnosis médica, búsqueda de minerales y pozos de petróleo. Se diferencian substancialmente de los programas de computadora convencionales porque sus tareas no tienen soluciones algorítmicas y porque a menudo deben obtener conclusiones que se basan en una información incompleta o incierta. En la construcción de tales sistemas expertos, los investigadores han encontrado que el almacenamiento de grandes cantidades de conocimiento, y no el uso de técnicas de razonamiento sofisticdas, es lo que confiere la mayoría de la eficacia al sistema. Tales sistemas expertos de alto nivel, anteriormente limitados sólo a proyectos de investigación académicos, están ya empezando a penetrar en el mercado.
2.3.2. Construcción de un Sistema Experto.
Por el momento, la construcción de sistemas expertos no es susceptible de ser aplicada a todos los campos del conocimiento. Para aplicar la ingeniería de conocimiento a una tarea, se deben cumplir los siguientes prerrequisitos :
A veces se puede construir un sistema experto que no cumple exactamente los prerrequisitos; por ejemplo, se podrían emplear para un problema las capacidades de varios hombres expertos, mejor que las de uno.
La estructura de un sistema experto es modular. Los hechos y otro conocimiento sobre el dominio en particular se pueden separar del procedimiento de inferencia - o estructura de control - para aplicar tales hechos, mientras que la otra parte del sistema - la base de datos general - es el modelo del "mundo" asociado con un problema concreto, su estado y su historia. También es deseable, aunque todavía no muy común, tener un lenguaje natural de relación para facilitar el uso del sistema tanto para el desarrollo como en el lugar de trabajo. En algunos sistemas complejos se incluye también un módulo de explicación, que permiten al usuario cuestionar las conclusiones del sistema y examinar el proceso de razonamiento que se ha seguido.
Un sistema experto se diferencia de los programas de computadora convencionales en varios aspectos importantes. En un programa convencional, el conocimiento relativo al problema y los métodos a emplear con estos conocimientos están interrelacionados , de tal forma que es difícil modificar el programa. En un sistema experto existe, por lo general una clara separación entre el conocimiento general relativo al problema (el conocimiento base)obtenido de la información sobre el problema actual y los métodos (la máquina de inferencia) para aplicar el conocimiento general a dicho problema.
Con esta separación el programa se puede cambiar con simples modificaciones de conocimiento base. Todo sto se cumple en particular para los sistemas basados en reglas, en los que podemos cambiar el sistema con la simple adición o sustracción de reglas al conocimiento base.
2.3.3. Sistemas Basados en reglas.
La solución más popular para representar el conocimiento de un dominio (hechos y heurísticos) que es necesario para un sistema experto es mediante las reglas de producción (también conocidas como reglas SITUACIÓN-ACCIÓN o reglas IF - THEN). Un ejemplo sencillo de reglas de producción es el siguiente: SI la potencia que recibe una cápsula espacial no es suficiente Y se dispone de potencia de reserva suficiente Y la causa que produjo el primer fallo no se va a producir de nuevo, ENTONCES conectar el sistema de potencia de reserva. Los sistemas basados en reglas trabajan mediante la aplicación de reglas, comparación de resultados y aplicación de las nuevas reglas basadas en situación modificada. También pueden trabajar por inferencia lógica dirigida, bien empezando con una evidencia inicial en una determinada situación y dirigiéndose hacia la obtención de una solución, o bien con hipótesis sobre las posibles soluciones y volviendo hacia atrás para encontrar una evidencia existente (o una deducción de una evidencia existente) que apoye una hipótesis en particular.
Algunos ejemplos de sistemas expertos son:
DENDRAL.- Fue ideado a finales de los setenta para generar una representación estructural de las moléculas orgánicas a partir de los datos de un espectrógrafo de masas. Tal solución tiene los siguientes pasos:
Este sistema ilustra la solución común de resolver problemas en IA de "generación y prueba".
MYCIN.- fue diseñado a mediados de los setenta. Es un sistema interactivo que diagnostica infecciones bacterianas y suministra la terapia de antibióticos. MYCIN representa el razonamiento experto como una serie de reglas condición - conclusión, que relacionan los datos del paciente con hipótesis de infección y al tiempo estiman la "certeza" de cada regla. Trabaja hacia atrás con diagnosis hipotética, empleando reglas para estimar los factores de certeza de las conclusiones basadas en los factores de certeza de su historial para comprobar si la evidencia apoya la diagnosis. Si no hay información suficiente para comprobar la hipótesis, pedirá al médico datos adicionales y evaluarán en forma exhaustiva todas las hipótesis. Cuando ha finalizado, MYCIN da los tratamientos para todas aquellas diagnosis que han alcanzado un alto valor de certeza.
El lenguaje es el medio de comunicación con todo el mundo. Estudiando el lenguaje, podemos entender más acerca del mundo. Podemos probar nuestras teorías acerca del mundo observando qué tan bien éstas soportan nuestro intento de entender el lenguaje. Y, si podemos construir un modelo computacional del lenguaje, tendríamos una herramienta muy poderosa para comunicarse con el mundo.
En gran parte de la vida humana la comunicación lingüística ocurre como habla. El lenguaje escrito es una invención reciente y todavía juega un papel menos importante que el habla en muchas actividades. Procesar el lenguaje escrito (asumiendo que está escrito de una forma no ambigua) es más fácil, en algunas formas, que procesar el habla. Por ejemplo, para construir un programa que entienda el lenguaje hablado, necesitamos todas las facilidades de un reconocedor de lenguaje escrito y también conocimiento adicional para manejar todo el ruido y ambigüedad de la señal de audio. Así, es útil dividir el problema de procesamiento del lenguaje en dos tareas:
2.3.4.1 Pasos en el Proceso.
Este proceso se divide en los siguientes pasos:
Al igual que sucede en el ser humano, la capacidad de visión proporciona un sofisticado mecanismo de percepción que permite a la máquina responder a su entorno de una manera inteligente y flexible. El uso de la visión y otros esquemas de percepción, están motivados por la constante necesidad de aumentar la flexibilidad y los campos de aplicación de los sistemas de robótica.
La visión artificial puede ser definida como los procesos de obtención, caracterización e interpretación de información de imágenes tomadas de un mundo tridimensional. Estos procesos, también habitualmente llamados visión por computadora, pueden a su vez ser subdivididos en seis áreas principales: 1) captación, 2) preprocesamiento, 3) segmentación, 4) descripción, 5) reconocimiento, 6) interpretación. La captación es el proceso a través del cual se obtiene una imagen visual. El preprocesamiento incluye técnicas tales como la reducción de ruido y realce de detalles. La segmentación es el proceso que divide una imagen en objetos que sean de nuestro interés. Mediante los procesos de descripción se obtienen características (por ejemplo: tamaño, forma) convenientes para diferenciar un tipo de objeto de otro. El reconocimiento es el proceso que identifica estos objetos (por ejemplo una llave inglesa, un tornillo, un soporte de motor). Finalmente, la interpretación le asocia un significado a un conjunto de objetos reconocidos.
Es conveniente agrupar estas diversas áreas de acuerdo con la complicación y delicadeza que lleva aparejada su implementación. Se consideran tres niveles de procesamiento: visión de bajo, medio y alto nivel. Debido a que no existen unas fronteras entre estos tres niveles, se utiliza un marco de trabajo útil para categorizar los diversos procesamientos que componen un sistema de visión artificial. Así se asocia a la visión de bajo nivel aquellos procesos que son primarios en el sentido de que pueden ser considerados "reacciones automáticas" sin requerir ningún tipo de inteligencia. Con este enfoque se trata como visión de bajo nivel a la percepción y el preprocesamiento.
Asociaremos a la visión de nivel intermedio aquellos procesos que extraen, caracterizan y etiquetan componentes de la imagen que se obtiene de la visión de bajo nivel. En estos términos, la segmentación, la descripción y el reconocimiento de objetos individuales pertenecen a la visión de nivel intermedio. La visión de alto nivel se refiere a procesamientos que tratan de emular la cognición. Mientras que los algoritmos de bajo y medio nivel conllevan un espectro de actividades bastante bien definidas, nuestro conocimiento y comprensión de los procesos de visión de alto nivel son considerablemente más difusos y especulativos, estas limitaciones dan lugar a la formulación de limitaciones e idealizaciones que tienen como objeto reducir la complejidad de esta tarea.
2.4. Los nuevos sistemas inteligentes.
Los sistemas difusos y las redes neuronales han tenido un interés creciente de los investigadores en varias áreas científicas y de ingeniería. El número y variedad de aplicaciones de la lógica difusa y las redes neuronales ha ido en aumento. Variando desde productos de consumo popular y control de procesos industriales hasta instrumentación médica, sistemas de información y análisis de decisión.
La lógica difusa está basada en la forma en que el cerebro maneja información inexacta, mientras las redes neuronales están modeladas en la arquitectura física del cerebro. Aunque las inspiraciones fundamentales para estos dos campos son muy diferentes, hay un número de situaciones paralelas que apuntan a sus similitudes. Los sistemas difusos y las redes neuronales son estimadores de modelo libre y sistemas dinámicos. Ellos comparten la habilidad común de mejorar la inteligencia de los sistemas que trabajan en un ambiente de incertidumbre, imprecisión y ruido. Ambos sistemas y sus técnicas han sido aplicados con éxito a una variedad de sistemas de control y dispositivos para mejorar su inteligencia. Se ha mostrado que los sistemas difusos y las redes neuronales tienen la capacidad de modelar procesos complejos no lineales a un grado arbitrario de exactitud.
En la década pasada, los sistemas difusos han desplazado a las tecnologías convencionales en muchas aplicaciones científicas y sistemas de ingeniería, especialmente en los sistemas de control y el reconocimiento de patrones. Tenemos también un rápido crecimiento en el uso de la lógica difusa en una amplia variedad de productos de consumo y sistemas industriales. Los ejemplos más sobresalientes son: máquinas lavadoras, cámaras de vídeo, cámaras de auto enfoque, aire acondicionado, máquinas lava trastos, transmisión de automóviles, guías de buques, trenes suburbanos, reguladores de control de combustión y control de calidad del cemento. La misma tecnología difusa, en la forma de razonamiento aproximado, está también resurgiendo en la tecnología de información, donde proporciona soporte de decisiones y sistemas expertos con las capacidades de razonamiento poderosos limitados a un mínimo de reglas.
Los conjuntos difusos introducidos por Zadeh en 1965 como una forma matemática para representar la vaguedad en lingüística, puede ser considerada como una generalización de la teoría de conjuntos clásica. La idea básica de los conjuntos difusos es muy sencilla. En un conjunto clásico (no difuso), un elemento del universo pertenece o no al conjunto. Esto es, la membresía de un elemento es dura - ya sea sí (está en el conjunto) o no (no está en el conjunto). Un conjunto difuso es una generalización de un intervalo unidad [0,1]. Así, la función de membresía de un conjunto difuso mapea cada elemento del universo de discurso a un rango del espacio el cual, en muchos casos, es el conjunto al intervalo de la unidad. Una de las más grandes diferencias entre los conjuntos duros y difusos es que el primero siempre tiene funciones de membresía únicas, mientras que todo conjunto difuso tiene un número infinito de funciones de membresía que pueden representarlo. Esto permite que los sistemas difusos puedan ser ajustados a su rendimiento máximo en una situación dada. En un sentido amplio, como apuntó Lotfi Zadeh, cualquier campo puede ser fuzzificado y generalizado reemplazando el concepto de conjunto duro en un campo fuente por el concepto de un conjunto difuso. Por ejemplo podemos fuzzificar algunos campos básicos tales como la aritmética, la teoría de grafos y la teoría de la probabilidad para desarrollar aritmética difusa, teoría de grafos difusos y teoría de probabilidad difusa, respectivamente; podemos también fuzzificar algunos campos aplicados tales como redes neuronales, algoritmos genéticos, teoría de estabilidad, reconocimiento de patrones y programación matemática para obtener redes neuronales difusas, algoritmos genéticos difusos, teoría de estabilidad difusa, reconocimiento de patrones difusos y programación matemática difusa, respectivamente. Los beneficios de tal fuzzificación incluyen mayor generalidad, poder expresivo más alto, una habilidad elevada para modelar problemas del mundo real, y una metodología para explotar la tolerancia a la imprecisión. Aquí la lógica difusa puede ayudar a alcanzar la tratabilidad, robustez y una solución a un costo más bajo.
Fundamentalmente hay dos enfoques principales en el campo de la inteligencia artificial (IA) para implementar inteligencia humana en las máquinas. Una es la IA simbólica, la cual está caracterizada por un alto nivel de abstracción y un punto de vista macroscópico. La psicología clásica opera a un nivel similar, y los sistemas de ingeniería del conocimiento y la programación lógica caen en esta categoría. El segundo enfoque está basado en los modelos biológicos de nivel microscópico. Es similar al énfasis de fisiología o genética. Las redes neuronales artificiales y los algoritmos genéticos son los ejemplos primordiales de este último enfoque. Ellos se originaron del modelo del cerebro y la evolución. No obstante, estos modelos biológicos no necesariamente se parecen a sus contra partes biológicas originales. Las redes neuronales son una nueva generación de sistemas de procesamiento de información que son construidos deliberadamente para hacer uso de algunos de los principios organizacionales que caracterizan al cerebro humano. El tema principal de la investigación de redes neuronales se enfoca sobre el modelado del cerebro como un dispositivo computacional paralelo para varias tareas computacionales que eran realizadas malamente por computadoras seriales tradicionales. Las redes neuronales tienen un gran número de elementos de procesamiento altamente interconectados que usualmente operan en paralelo y están configurados en arquitecturas regulares.
Los algoritmos genéticos (AG) están desarrollados para simular algunos de los procesos observados en la evolución natural. Los principios subyacentes de los AG fueron publicados por Holland [1962]. La estructura matemática fue desarrollada en los sesenta y se presenta en su libro pionero[Holland 1975]. Los algoritmos genéticos han sido empleados en dos áreas principales: optimización y aprendizaje de máquina. En las aplicaciones de optimización, han sido usados en campos muy diversos tales como optimización de funciones, procesamiento de imágenes, el problema del agente viajero, identificación de sistemas, y control. En aprendizaje de máquina. Los AG han sido usados para aprender reglas de cadenas sintácticamente simples IF - THEN en un ambiente arbitrario.
2.5. Instituciones de investigación de sistemas inteligentes en Japón.
Después de las primeras aplicaciones exitosas de los primeros sistemas de control difusos, se pudo establecer que la difusión podía hacer máquinas mas listas. A pesar de las evidencia del enorme potencial que la nueva tecnología ofrecía, los científicos occidentales, en general, ignoraron o atacaron a la lógica difusa. En contrapartida, los japoneses, una vez mas, reaccionaron rápidamente a las posibilidades de aplicación de la lógica difusa y decididamente la aplicaron y lanzaron la nueva era de las máquinas comerciales inteligentes de alto consumo.
2.5.1 Un Impresionante Desarrollo
El primer controlador basado en lógica difusa fue desarrollado por E. H. Mandani y S. Assilian del Colegio Queen Mary, Inglaterra en 1975 y fue aplicado para controlar una máquina de vapor simple. Ellos pudieron demostrar que su modelo tenia una ventaja definitiva sobre los modelos existentes, ya que:
Los modelos con lógica difusa trabajan bien incluso cuando la relación entre las variables de entrada y salida del control no es lineal.
Son mucho más robustos con respecto a cambios en los parámetros controlados del sistema.
Después de presentar este trabajo, Mandani trato infructuosamente de conseguir fondos para sus investigaciones. Incapaz de obtener fondos, finalmente abandono su línea de investigación para buscar otras oportunidades. Sin embargo, su trabajo no paso desapercibido en Japón, y aproximadamente 10 años después la Hitachi anunció y puso en operación el primer sistema de control automático de metros empleando un controlador con lógica difusa, en Sendai Japón, en 1987.
En ese mismo año Takeshi Yamakawa demostró su control difuso para el péndulo invertido. Estos dos sistemas sirvieron como catalizadores para la explosión en el interés por el tema del control difuso. A partir de los diseños originales de Yamakawa, la presentación de patentes de control difuso se expandió rápidamente, multiplicando el número de aplicaciones.
Para julio de 1991, solamente la compañía Omron había obtenido 700 patentes para dispositivos con lógica difusa. Numerosos productos comerciales inteligentes que usan tecnología difusa están disponibles en Japón, y muchos de ellos se venden ahora alrededor del mundo. Basta decir que ya para 1993 se reportaron mas de 1500 aplicaciones industriales y comerciales de sistemas difusos.
2.5.2. Sociedades y Laboratorios Fuzzy en Japón
La Sociedad Japonesa de Teoría e Investigación Difusa (SOFT) fue fundada y tuvo su primera reunión en 1984 con cerca de 20 miembros. En 1991 tenía afiliados 1800 socios y 100 corporaciones
LIFE
El laboratorio Internacional para Investigación de la Ingeniería de Sistemas Difusos (LIFE) fue un proyecto de 6 años (6/88-3/95) y fue fundado por el ministro Japonés de Comercio Internacional e Industria(MITI) en conjunción con 49 corporaciones. Sus objetivos fueron: a) Promover la Investigación y Desarrollo en aplicaciones de teoría difusa a la ingeniería. b) Promover el intercambio local y nacional sobre el estudio de la teoría difusa. El director es el Doctor Toshiro Terano, uno de los primeros y más conocidos investigadores japoneses en sistemas difusos.
En sus inicios LIFE fue organizado en tres ‘’laboratorios’’:
Control difuso; especialmente para procesos de producción y robótica.
Procesamiento difuso de información Intelectual; para sistemas de soporte de decisiones, entendimiento de imágenes, esqueletos de sistemas expertos, sistemas de diagnostico para estaciones de potencia, entendimiento de lenguaje para robots, y evaluación y entendimiento de información numérica.
Computadora Difusa; incluyendo Arquitectura de Sistema, Hardware y Software.
En 1990 se hizo un reajuste y se consideró que el área de control difuso estaba suficientemente desarrollado, por lo que se eliminó como área de investigación, y se dejó su futuro desarrollo a las corporaciones privadas que aprovechan su aplicación. Finalmente se reagrupó LIFE en tres áreas con tres proyectos cada una:
Grupo de Soporte de Decisiones.
Robots Inteligentes.
Circunferencia Computacional.
Además de promover las aplicaciones industriales, LIFE también juega un rol educacional dándole oportunidad a investigadores jóvenes que están involucrados en el proceso de obtener grados universitarios avanzados. Otras de sus funciones importantes incluyen la organización de conferencias y seminarios nacionales e internacionales.
FLSI
El Instituto de Sistemas de Lógica Difusa (FLSI) fue establecido en marzo de 1990 para conducir investigación experimental en el procesamiento de información difusa y neurociencias, y promover el más amplio uso de los hallazgos científicos en estos dominios. Su fundador fue el profesor Takeshi Yamakawa. Su presupuesto inicial fue de $750,000.00 US dólares proporcionados por 13 corporaciones privadas trabajando en conjunto con el Tecnológico de Kyushu y la prefectura de Fukuaka. La participación de la prefectura tenía el objetivo de establecer un nuevo centro de industria tecnológica en la región de Lizuka, antigua región minera con economía deprimida. Además de los trabajos de Yamakawa sobre inferencia difusa y chips defuzzicadores, han desarrollado recientemente un chip fuzzy-neural para reconocimiento de patrones. Actualmente el número de corporaciones japonesas haciendo aplicaciones y colaborando en la investigación de sistemas difusos incluyen todos los grandes nombres de la industria japonesa, dentro de los cuales se encuentran las compañías; Sony . Matsushita (National/Panasonic) . Nissan . Hitachi . Omron Corporation, etc. Así mismo, las grandes universidades de Japón colaboran en el esfuerzo de investigación de esta tecnología emergente.
2.6. Esfuerzos en Estados Unidos.
A pesar que la lógica difusa fue ‘’inventada’’ en EUA, la reacción generalizada tanto a nivel científico como empresarial fue de claro antagonismo en algunas ocasiones, de mofa en otras, o de completo menosprecio a las muestras de éxito en diferentes tipos de aplicaciones, de los principios fundamentales de la nueva metodología. Algunas de las opiniones vertidas por diferentes miembros de la comunidad científica y corporaciones, se presentan a continuación.
‘’La teoría difusa esta equivocada, y es perniciosa. Lo que se necesita es más pensamiento lógico, no menos. El peligro de la lógica difusa es que motiva la clase de pensamiento impreciso que nos ha causado tantos problemas. La lógica difusa es la cocaína de la ciencia’’. Prof. William Kahan, U.C. Berkeley.
‘’Difusión es probabilidad disfrazada. Yo puedo diseñar un controlador con probabilidad que pueda hacer las mismas cosas que se pueden hacer con lógica difusa’’. Prof. Mylon Tribus, al oír del metro de Sendai, Japón.
Recientemente se ha dicho que algunas compañías estadounidenses han estado investigando y aplicando la teoría difusa en sus productos, pero sin divulgarlo, por temor a la reacción adversa de la gente a adquirir artículos con componentes ‘’Fuzzy’’. Por ejemplo, se especula sobre la aceptación que puede tener en el mercado americano una cámara que se anuncie como difusa, y generalmente se concluye que poca gente se sentiría atraída por un producto del que la gente espera mucha precisión.
En los últimos años, y motivados precisamente por el éxito económico de los productos ‘’difusos’’ japoneses, las compañías norteamericanas están cambiando de actitud, y cada vez son más las que aceptan e incluso divulgan públicamente la inclusión de componentes difusos en sus productos. Así mismo, la comunidad científica ha comenzado a aceptar la validez y utilidad de la lógica difusa como una alternativa complementaria de las tecnologías existentes. Esto se refleja en el número de congresos dedicados a la lógica difusa que se organizan anualmente en EUA, así como en el número y calidad de los trabajos presentados en ellos.
Según Bart Kosko[4], el futuro estará lleno de artefactos listos. Tendrán altos coeficientes intelectuales en las máquinas que se pueden ver completamente diferentes a las maquinas inteligentes actuales (vídeo cámaras, lavadoras, etc). Habrá computadoras pequeñas y rápidas que se colarán nuestras vidas, trabajo y diversión. Los grandes sistemas y redes también se volverán listos. Estarán enlazados los satélites de comunicaciones, redes de crédito y salud, entretenimiento y apuestas, automóviles, calles y redes de tráfico, redes de noticias y encuestas, redes de gobierno, y hasta redes espías. En sí, las máquinas se reducirán y contarán con sensores y procesadores de señales más finos. Y serán capaces de generar sus propias reglas difusas y redes.
2.7.1. Una Lección para ser Aprendida:
El profesor Lotfi Zadeh (Zah-da) viajaba en el reluciente nuevo metro de Sendai, Japón. Pocos pasajeros se preocupaban de agarrarse de las barras, incluso cuando el metro arrancaba o se detenía.
El tren paraba con absoluta precisión y ahorraba un 10% de combustible.
Zadeh no era experto en metros, era profesor de la Universidad de California en Berkeley, pero conocía bien el secreto que controlaba el tren.
Se controlaba con la lógica difusa que él había inventado en 1965.
En 1991 el metro de Sendai había estado corriendo por 4 años, y era entonces el sistema más avanzado del mundo.
Ese mismo año, en los Ángeles se construía un metro y necesitaba un sistema de control, pero nunca se consideró la lógica difusa como alternativa.
El gerente de ingeniería para el control automático del tren dijo:
" He oído hablar muy vagamente de la lógica difusa, pero no estoy muy familiarizado con ella ".
Añadió que ninguna de las propuestas para el diseño del control del metro usaba lógica difusa.
"No lo hemos requerido y ninguno de los proponentes a decidido hacerlo".
Esto se debe a que la lógica difusa ha sido despreciada en los EUA.
Desde 1973 Zadeh había mostrado como la lógica difusa podía hacer maquinas más inteligentes, y por 1979 una firma Danesa la usaba en un complejo proceso industrial ahorrándole decenas de miles dólares.
La técnica existía más o menos completa. Los japoneses observaron el éxito y la comenzaron a usar, pero paradójicamente, ninguna compañía estadounidense hizo lo mismo.