Para comprender las Ontologías

“… la palabra ‘significado’ es probablemente la palabra cuyo significado es, de todo el lenguaje, el más difícil de hallar. ¿Qué significa ‘significar’? Me parece que la única respuesta que podemos dar es ‘significar’ significa la capacidad de cualquier clase de dato para traducirse a un lenguaje diferente”. [1]

Es conveniente resaltar la importancia de las ontologías, su actual definición y alcances, ya que este concepto se ha adaptado según las circunstancias a distintos contextos y para los fines de estas reflexiones es un factor de alta importancia que vamos a repasar a continuación.

Asumiendo con González Pérez, Y. [2], que, derivado de su significado original y con una proyección más pragmática y aplicada, llegó el término ontología a la Inteligencia Artificial y a la Ingeniería del Conocimiento a finales de la década de los años 80. En este ámbito, surge como propósito principal el representar un conjunto de conceptos jerárquicamente organizados, descritos en algún sistema informático, como medio para compartir el conocimiento en los distintos dominios.

Una década después, comenzaron a aplicarse en la web para la inclusión de descripciones semánticas explícitas de los recursos (contenidos y servicios). Con ello, para muchos autores, las ontologías se convirtieron en un eje fundamental en las nuevas tecnologías para la web semántica, y transformaron radicalmente algunos de los conceptos y hábitos más arraigados en la sociedad.

Al considerar la aplicación de las ontologías en el entorno web, puede decirse que Internet es primero un medio de comunicación y después un sistema de almacenamiento y recuperación de la información. Sin embargo, las tendencias actuales apuntan a la desaparición progresiva de estas diferencias, al concebirse la red como un espacio en el que convergen el almacenamiento, la recuperación, la diseminación y la comunicación de la información.

Constituyen hechos contradictorios la promesa de la red de situar todo el conocimiento humano a disposición de cualquier individuo, en cualquier momento, con independencia de la localización geográfica y la insatisfacción que experimentan los usuarios para alcanzar esta meta. La asunción de que en la red se encuentra potencialmente todo el conocimiento alcanzado a nuestros días o está en vías de; localizar la información veraz se ha convertido en un proceso complejo. La productividad de las búsquedas y la relevancia de los documentos recuperados no siempre resulta la esperada y mucho menos la deseada.

La esencia del problema no radica en cómo saber si hay algo determinado sino dónde está, en cómo reconocer en un medio sin regulaciones, cuestiones como autoría y fiabilidad, en saber si un medio así, ¿puede emplearse para la creación intelectual, para la construcción de algo nuevo o valioso?.

Distintos autores han definido el término información. Cada una de estas definiciones ha estado matizada por el grado de abstracción de los conceptos y su circunscripción al contexto en el que se aplica.

En el terreno de la organización de la información y el conocimiento es la definición Floridi que identifica tres categorías para explicar la ambigüedad del fenómeno llamado información: información como realidad -información ecológica-, información para la realidad -información instructiva- y la información sobre la realidad -información semántica. Esta última categoría se encuentra muy relacionada con las ontologías, en tanto que ellas posibilitan representar los conceptos a partir de su significado [3].

Para Arano: “Una ontología es una representación formal del conocimiento donde los conceptos, las relaciones y las restricciones conceptuales se explicitan mediante formalismos en un determinado dominio. En virtud de ello, la ontología es uno de los módulos asociados a un sistema de conocimientos que apoya semánticamente las unidades léxicas; estas se describen como objetos lingüísticos en una base de datos léxica que se relacionan con una jerarquía conceptual localizada en una ontología” [4].

Tanto en el mundo de la información como en el de las ontologías, no hay verdades absolutas, en el caso de estas últimas, debido a que son entes que se construyen artificialmente, es decir, se crean no se descubren. Esta puede ser una de las razones por las cuales se proponen tantos modelos base de conocimientos para su construcción en los diversos lenguajes que coexisten actualmente.

Reflexionando acerca de que estamos ante un cambio en el paradigma cultural, que requiere el concurso de varias disciplinas para su implementación y alcanzar algún día los ideales de organización y recuperación de la información que hoy parecen como una utopía, es una apuesta básica que justifica plenamente su correcta y plena integración hacia el fin que proponemos.

En este sentido, resulta esencial la representación y organización de la información. Ya que un buscador como Google, por ejemplo, no puede asumir la función de un profesional de la información en sus distintos perfiles. La información se encuentra desorganizada y las búsquedas se confeccionan, a partir de cadenas específicas, que no contemplan aspectos semánticos.

Las unidades de información se han dedicado históricamente a la tarea de organizar y representar los diversos recursos de información existentes. Asintiendo Wert que: “sus profesionales, y en especial los bibliotecarios, fueron probablemente los primeros en comprender que para encontrar rápidamente información era mejor buscar en una representación sintetizada de ésta. Al desarrollar catálogos de sus colecciones, en especial, ficheros organizados alfabéticamente por campos especialmente sensibles como autor, título, materia, fecha, inventaron, en el a decir de Wert, sin saberlo, los Metadatos [5].

En este sentido, Floridi asegura que «la biblioteca puede desaparecer, a medida que nos movemos desde una biblioteca de posesión y préstamo, que almacena conocimiento físicamente registrado sobre papel, hacia la biblioteca de consulta, que provee acceso a la información electrónica en la red [6].

Por eso más que una desaparición, se vislumbra una evolución y adecuación necesaria de los procesos adaptados al entorno web. Ahora, como nunca antes, se necesita de estos procesos que facilitan la búsqueda, recuperación y diseminación de la información para crear un nuevo conocimiento.

La utilización de las ontologías postula, que mientras más ordenada y mejor procesada se encuentre la información, en particular, a un nivel en el que se establezca su significado, será más fácil desarrollar la selección y posterior adquisición. Sobre la base de este supuesto, la captura de información puede realizarse desde disímiles perspectivas con el descubrimiento de nuevos modelos de similitud, la asociación entre conceptos y la utilización de un mayor cúmulo de puntos de acceso. En este contexto, varían muchos de los supuestos tradicionales, por ejemplo, las fuentes de información que se emplean para la selección.

Por su parte, la adquisición puede efectuarse sobre la base de sistemas integrados, debido a la interacción existente entre disímiles dominios heterogéneos y con el auxilio las llamadas redes de conocimiento.

Agregamos una definición de una ontología como “un instrumento de organización y representación del conocimiento que permite hacer explícitas las reglas implícitas de una parte de la realidad. Idealmente, su presentación formalizada permite que estas declaraciones explícitas sean independientes del sistema que las utiliza y que, a su vez, pueda reutilizarse por otros sistemas.

No obstante, sobre la base de las ontologías y las estructuras con las que estas operan, su génesis puede convertirse en un proceso que organice el conocimiento a la vez que lo transfiere y permite recuperarlo, más allá de los límites de la información meramente bibliográfica, a partir del empleo de un mayor número de elementos en la descripción formal de la información.

La clasificación, sobre la base de las ontologías, se concibe como una categorización de la información, proceso que se adecua al tipo de comunicación que tiene lugar en la web. En esta, la información fluye por medio de categorías, como expresión de clases que agrupan conceptos a partir de su similitud: palabras en general que componen los contenidos discursivos y palabras específicas que determinan en esos contenidos los conceptos particulares.

Este fenómeno posibilita reflejar con mayor profundidad las propiedades esenciales de los conceptos y que estos se enriquezcan. Además, cuando una entidad se asigna a una categoría se crea un contexto (dominio) que no sólo ofrece información sobre la entidad, sino también sobre las formas de interactuar con ella.

Históricamente se ha tratado de clasificar el conocimiento -a decir de Shera- se identifican en este sentido cuatro líneas rectoras: el orden universal, la unidad del conocimiento, la similitud entre miembros de una clase y las esencias intrínsecas de las entidades [7]. Según Jacob, con la posible excepción del orden universal, esta exposición de Shera puede concebirse desde las tres ideas básicas que propone la teoría clásica de las categorías [8]:

I. “La aserción de que una categoría se define por una representación sumaria, es una declaración de la similitud esencial de miembros de la clase.

II. La aserción de que una categoría se define por un conjunto de rasgos esenciales, es una declaración del ser intrínseco de una clase.

III. La aserción de que los rasgos definidos se heredan en una estructura jerárquica de categorías, es una declaración de la unidad del conocimiento”.

Ambos procesos son mecanismos que buscan establecer el orden por medio de la agrupación de fenómenos relacionados, además, al nivel lógico, ambos son lenguajes controlados. No obstante, mientras la clasificación es rigurosa, porque estipula que una entidad es o no es un miembro de una clase particular, la categorización es flexible, creativa y delinea las relaciones que no son válidas entre las entidades-asociaciones. Estas relaciones se establecen sobre la base del simple reconocimiento de las similitudes que existen entre los grupos de entidades, esta es la base para la flexibilidad. En este último apartado, es necesario tomar precauciones para una correcta concepción y delimitación de las relaciones de similitud.

La categorización puede verse desde la visión de una clasificación que no se restringe a estructuras jerárquicas, esto no resulta ilógico si se retoman las categorías esbozadas por el Bibliotecario Ranganathan, S. R., aunque las actuales supongan un paso de avance. Pues, según Almeida, las relaciones ontológicas no tienen como finalidad definir cierto orden en los conceptos; por el contrario, determinan la naturaleza de las relaciones que tienen lugar entre ellas. Luego, por analogía, en función de las relaciones identificadas, es que se determinan las relaciones jerárquicas; por tanto, se priorizan las interconexiones entre los conceptos [9].

Las diferencias que distinguen los sistemas de clasificación y categorización radican en la constitución y modelación de la información, a partir de: los distintos dominios y sus atributos, las formas de interacción, el desarrollo interno de cada dominio, el ciclo de vida de la información en la red, su evolución hacia umbrales superiores o cambios de paradigmas y las ventajas que introduce el procesamiento de la información con máquinas, sobre la base del procesamiento algorítmico de la información y su compresión por “agentes inteligentes”, que Wikipedia define como: una entidad capaz de percibir su entorno, procesar tales percepciones y responder o actuar en su entorno de manera racional, es decir, de manera correcta y tendiendo a maximizar un resultado esperado.

En este sentido, la indización asume el reto de reflejar el movimiento de los conceptos y las interconexiones entre ellos, así como los cambios cualitativos y cuantitativos que estos conceptos y fenómenos pueden generar. Por tanto las ontologías significan pues, una evolución de los instrumentos de representación y organización del conocimiento, así como una ruptura en el pensamiento de los que las construyan, en tanto, se conciben relaciones nunca antes pensadas.

De momento, sólo se vislumbra este fenómeno en el medio digital, como expresión de la incesante búsqueda de nuevos instrumentos para mejorar la organización y recuperación de la información en la red y en los servicios tradicionales. Una ventaja de los lenguajes ontológicos, es el hecho de que ellos no desarrollan sólo temas o vocabularios que asocien recursos. Estos instrumentos como repertorios del conocimiento compartido, retoman aspectos teóricos que tienen sus bases en las raíces de la profesión de información:

Se piensa que este proceso no debe observarse desde la perspectiva de la sustitución de instrumentos como los tesauros (lista de palabras o términos controlados, empleados para representar conceptos), sino como una evolución necesaria de ellos. Algunos puntos de ruptura son:

  • Los términos en los cuales se basan las ontologías se encuentran más cercanos al lenguaje natural, en tanto se defiende la utilización de adjetivos, adverbios, verbos, prefijos.
  • El sustantivo no siempre tiene un lugar primordial.
  • Permiten expresar los conceptos como se conciben por los usuarios, en toda su complejidad de interconexiones concretas y en función de los distintos sistemas de los que forman parte.
  • Evidencian las contradicciones reales que existen entre los conceptos de la realidad, y portan un desarrollo semántico más profundo para las relaciones de clase/subclase y las relaciones cruzadas.
  • Posibilitan el trabajo con sistemas heterogéneos.
  • Contemplan un mayor número de relaciones diversas entre los conceptos, que proceden del esquema conceptual con el disponible en el dominio formalizado.

Desde esta perspectiva Ding y Foo, opinan que: “las diferencias fundamentales entre una ontología y un vocabulario de representación convencional se sitúan en el nivel de abstracción, en las relaciones entre los conceptos, en la capacidad de ser comprensibles para las máquinas y, más importante aún, en la expresividad que pueden proporcionar” [10].

Es un hecho que las relaciones concebidas en los lenguajes ontológicos, constituyen una ruptura con las concepciones pre existentes hasta ahora en el procesamiento de la información. Por lo que es visible entonces, una ruptura de las posibles barreras existentes entre la clasificación y la indización, debido a que el sistema de categorías empleado, aproxima la concepción de los sistemas de clasificación a la de los tesauros, y hace más difusa la distinción entre categoría y palabra clave; como parte de los diccionarios de conceptos relativos a cada dominio o contexto como veremos más adelante.

Además, se evidencia la unión de sistemas jerárquicos que, a la vez, son asociativos, que se contraponen en menor medida al lenguaje natural. De igual forma, los conceptos adquieren un significado propio en función del contexto en que se aplican. A esto, se une el proceso de conformación de las ontologías en función del sistema de información en el que se utilizará en un dominio determinado.

También, implican los procesos de análisis y síntesis. El primero, para descomponer el concepto en sus elementos y el segundo, para componerlos. Así, en función de las relaciones descritas, se perfilan las relaciones inversas, transitivas y simétricas para representar estos conceptos en toda su magnitud. Estos procesos adquieren una gran trascendencia para la conformación de las inferencias, porque garantizan que estas no sean erróneas.

Las ontologías se convierten en una herramienta que permite almacenar el conocimiento para luego garantizar su recuperación en sistemas automáticos capacitados para efectuar disímiles deducciones a partir de esa variedad de relaciones entre los conceptos.

El almacenamiento, como resultado del procesamiento de la información, integra elementos nunca antes pensados. En este ámbito, actualmente, no tiene sentido almacenar varias copias de determinado documento y con ello, se rompe otro esquema del que ha partido la selección y adquisición y que ha incidido en este proceso. Además, el almacenamiento constituye la base inmediata para la recuperación, transferencia, reutilización y diseminación del conocimiento, con varias funciones simultáneamente.

Se entrelazan el almacenamiento activo y pasivo, en tanto, pueden localizarse en el mismo soporte y formato, acompañado uno del otro, se rompen las barreras físicas y de espacio. Por tanto, se habla de una recuperación más efectiva, en tanto el almacenamiento, sin intermediario o, mejor dicho, realizado mediante “agentes inteligentes” puede recuperar la información almacenada en el fondo pasivo.

Las ontologías por tanto, fungen como herramientas tecnológicas que:

  • Facilitan e intervienen en la selección y adquisición de la información.
  • Enriquecen el procesamiento de la información, a partir de una descripción semántica más profunda.
  • Propician un almacenamiento que sienta nuevos espacios para la búsqueda, recuperación y diseminación efectiva de la información.

Cuando se representa y organiza información, se alude implícitamente a la objetividad necesaria para lograr una representación de la información/conocimiento que satisfaga las necesidades de los usuarios. Por tanto, el conocimiento representado debe ir de la apariencia que puedan tener los conceptos a su verdadera esencia. Otro reto que retoman las ontologías y sobre el que se debe reflexionar es: ¿cómo desprender lo esencial de lo aparente en cada dominio del conocimiento y hacerlo entendible para las máquinas?.

Además, existe el desafío de concebir una ontología puramente pragmática y adaptada a las necesidades de cada dominio y que abarque una parte importante del léxico general, más aún si se considera que lo deseado es procesar la información a partir de su semántica, o sea, su significado.

Vital importancia adquiere este hecho, si se considera que ellas actúan como herramientas de referencia en tanto proveen la estructura para crear un mapa de la ruta semántica de los campos individuales y la relación entre ellos. De esta forma, soporta la recuperación de la información sobre la base de las relaciones establecidas.

Desde un plano lingüístico, a partir de una perspectiva consistente y precisa, deberán definirse los nuevos términos para la búsqueda y recuperación de la información en correspondencia con las posibilidades que las ontologías ofrecen. En este sentido, debe aclararse el significado de cada término como miembro del sistema o el particular diccionario de conceptos y establecer las reglas en las cuales se basan las relaciones de un dominio determinado. Aparejado a este hecho, es preciso que metodológicamente se conciba el establecimiento de las relaciones entre los distintos conceptos.

Es recomendable por tanto, que exista una epistemología que respalde cada dominio del conocimiento para que los individuos no capten los caracteres generales y esenciales de estos términos desde distintas perspectivas, a partir de la variedad de relaciones y términos que estos sistemas presentan.

Es necesario tener cuidado para establecer las cualidades que definen los conceptos, puesto que sólo deben jerarquizarse aquellas que realmente aporten mayor valor y que expresen las distintas formas en que el concepto puede estar inserto. Unido a esto, los instrumentos que se generen, en su nueva variedad de relaciones, deben velar los elementos heredados por las clases inferiores y las restricciones efectuadas, porque su errónea realización puede conllevar a una inferencia errada. Una de las soluciones en este sentido, puede ser la definición obligatoria de las relaciones y las relaciones inversas.

Uno de los inconvenientes que observamos en el esfuerzo que implican los nuevos modelos que se diseñan para los profesionales que los construyen, debido a su grado de complejidad y las nuevas asociaciones que establecen. Además, se habla en todo momento de representar y organizar el conocimiento, y esto supone un proceso más complejo si se logra materializar.

Otro problema registrado, (desde la perspectiva de González Pérez, Y.), es que no existe una metodología establecida para la creación de ontologías como un algoritmo que facilite la adquisición de los conceptos. Más bien, se identifican líneas maestras que parten de los estudios de determinados autores; en general, las herramientas, los lenguajes y los métodos son disímiles, tendencia que habría que superar por una comunicación más fluida y veraz.

Si bien no existe una única aproximación a su construcción, en función de los diversos contextos, sí deben existir principios comunes que rijan dicho esfuerzo para poder compartir ontologías y combinar el conocimiento de distintos dominios.

Las ontologías son portadoras de una visión de sistemas abiertos que interaccionan, que no pueden estar inmutables ante nociones fundamentales establecidas o nuevas. Potencian sistemas donde los conceptos deben ser flexibles, luchar contra las concepciones anquilosadas, y unen indisolublemente las categorías contenido y forma, donde el contenido adquiere un factor determinante.

Si se conoce que esta brecha existe para el ambiente web, los ingenieros del conocimiento o del software deben convertirse entonces, en uno de los objetivos prioritarios de los especialistas que organizan la información, debido a las perspectivas que brindan para la localización, identificación, relación, mantenimiento y selección de recursos de información. En este marco, las ontologías fungen como las estructuras cognitivas en las que se formaliza el contenido semántico que deben interpretar los “agentes inteligentes”.

Los cambios planteados se asocian a los cambios de paradigmas ocurridos en la especialidad y la consiguiente evolución de un paradigma físico a un paradigma cognitivo, en el que se conciben actualmente las ontologías. No obstante, este paradigma, obvia el contexto social y material en el que se desempeña el ser humano.

Interesante resulta el paradigma social-epistemológico desarrollado por Hjorland y Albrechtsen. En este, la investigación de los campos cognitivos está en relación directa con las comunidades discursivas. Uno de sus aspectos más trascendentales es renunciar a la búsqueda de un lenguaje ideal para la representación del conocimiento como expresión de un algoritmo ideal para modelar la recuperación de la información, aspecto al que aspiran, tanto el paradigma físico como el cognitivo.

Por tanto, la construcción de ontologías y por qué no, las tendencias actuales de la organización y representación de la información, se ubican en las fronteras existentes entre estos dos paradigmas, entre el deseo de conformar un lenguaje universal y, a la vez, uno privado para cada dominio.

En la línea con las disertaciones de González Pérez, Y., sostenemos sus consideraciones finales que rezan que aún con el avance experimentado por las ontologías como herramienta para la representación y organización de la información queda un largo camino por recorrer para alcanzar un consenso sobre las formas normalizadas de organizar y describir el conocimiento, aun cuando las ontologías se revelan actualmente como una de las vías más efectivas para estos fines en el ambiente de las redes.

Las ontologías son un fenómeno cuyo estudio debe abordarse insistimos en forma multidisciplinaria; en este sentido, los profesionales de la información pueden aportar un cúmulo importante de conocimiento, debido a su experiencia práctica.

Suponen una evolución y ruptura de los procesos desarrollados habitualmente para organizar y representar la información, una evolución necesaria para el ambiente donde operan.

Las ontologías surgieron en el marco de la ingeniería del conocimiento, del software y de las redes, por tanto, demanda de sus creadores conocimientos y habilidades en esta esfera. Fungen como bases de conocimientos y de datos que traspasan las fronteras horizontales de los procesos que integran la etapa de organización y representación de la información y son herramientas clave en cada uno de ellos.


[1]  Lévi- Strauss, Claude: Myth and meaning, Schocken Books, New York, 1979. En definitiva, aclara a continuación Strauss, esto es imposible sin un orden, sin reglas de traducción: cómo una palabra sustituye (traduce) a otra. En Wert, Carlos.: Lengua, Internet e instituciones de memoria. Cervantes.es

[2]  González Pérez, Y. Resumen, adaptación y corrección, en su caso, de la publicación en base a la recopilación, estudio, análisis y conclusiones de González Pérez, Yanelis en Scielo por G. C., M. para esta obra bajo el Copyright: © ECIMED. Contribución de acceso abierto, distribuida bajo los términos de la Licencia Creative Commons, reconocimiento No Comercial compartir igual 2.0, que permite consultar, reproducir, distribuir, comunicar públicamente y utilizar los resultados del trabajo en la práctica, así como todos sus derivados, sin propósitos comerciales y con licencia idéntica, siempre que se cite adecuadamente el autor o los autores y su fuente original. El autor de la MI utiliza esta fuente y buena parte de las disertaciones, propias de la autora y los autores consultados, citados todos adecuadamente según petición expresa de la fuente, con el fin de reproducir un conocimiento definido y justificado de forma conveniente y practica a los intereses de esta obra, con la justa y sobria readaptación y ajuste a las ideas pertinentes a la MI.

[3]  Floridi, L.: Open problems in the philosophy of information. En Las ontologías en la representación y organización de la información. En Gonzáles Pérez, Yanelis, Ibíd.

[4]  Arano, S.: La ontología: una zona de interacción entre la Lingüística y la Documentación. Hipertext.net 2003, Ibídem.

[5]  Wert, Carlos: En Cervantes.es , en op. cit..

[6]  Floridi, L.: The Internet: wich future for organised knowledge, Frankestein or Pygmalion? The Electronic Library 1996; en Gonzalez Pérez, Yanelis, op. cit..

[7]  Shera, J. H.: Bibliographic organization. Chicago: University of Chicago, 1951, en op. cit..

[8]  Jacob, Elin K.: Classification and categorization: a difference that makes a difference. en: sils , en op. cit..

[9]  Almeida Campos ML de J.: Lenguaje documentario: una perspectiva teórica. Infodiversidad, 2004, en op. cit..

[10]  Ding Y. Foo S.: Ontology Research and Development. Part 1- A Review of Ontology Generation. Journal of information Science 2002, en op. cit..

Deja un comentario