Archivo de la etiqueta: Taxonomías

Taxonomía de la Ciencia Abierta con Julio Santillán Aldana y con Remedios Melero. Planeta Biblioteca 2023/07/21

Taxonomía de la Ciencia Abierta

con Julio Santillán Aldana y con Remedios Melero

Planeta Biblioteca 2023/07/21

ESCUCHAR EL PROGRAMA

Ir a descargar

Silveira, L. da, Ribeiro, N. C., Melero, R., Mora-Campos, A. ., Piraquive-Piraquive, D. F. ., Uribe-Tirado, A., Sena, P. M. B., Polanco-Cortés, J. ., Santillán-Aldana, J. ., Silva, F. C. C. da ., Araújo, R. F. ., Enciso-Betancourt, A. M. e Fachin, J. (2023) “Taxonomia da Ciência Aberta: revisada e ampliada”, Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, 28, p. 1–22. doi: 10.5007/1518-2924.2023.e91712.

Artículo en español

Hoy tuvimos la oportunidad de conversar con Julio Santillán Aldana y Remedios Melero acerca de la publicación de una taxonomía de la Ciencia Abierta, un proyecto en el que representan a un grupo de 12 investigadores de Latinoamérica y España. Durante la entrevista, exploramos los detalles de este proyecto y sus implicaciones en la comunicación científica. El proyecto de la taxonomía de la Ciencia Abierta surgió como una iniciativa para clasificar y organizar de manera sistemática las diferentes prácticas, enfoques y metodologías que conforman el campo emergente de la Ciencia Abierta. Este enfoque representa una mirada inclusiva y colaborativa hacia la investigación científica, y se centra en la apertura y accesibilidad de datos, métodos y resultados para fomentar la transparencia y la colaboración. En cuanto a las implicaciones en la comunicación científica, la taxonomía de la Ciencia Abierta proporciona una estructura clara para que los investigadores, instituciones y comunidades puedan entender, discutir y aplicar conceptos relacionados con la Ciencia Abierta de manera más precisa y efectiva. Esto facilita la comunicación entre expertos y el público en general, lo que a su vez puede aumentar la difusión y comprensión de las prácticas de Ciencia Abierta en la comunidad científica y en la sociedad en general. La importancia de disponer de un recurso como esta taxonomía radica en que proporciona una base sólida y estructurada para avanzar en la comprensión y la aplicación de la Ciencia Abierta. Al contar con una clasificación precisa de las prácticas y enfoques dentro de este ámbito, se facilita la colaboración entre investigadores y la identificación de áreas de mejora y oportunidades para futuras investigaciones. Además, este recurso también puede servir como guía para las instituciones y políticas científicas en la promoción de prácticas más abiertas y transparentes.

¿Qué diferencia una taxonomía de una ontología y una clasificación?

Una taxonomía, una ontología y una clasificación son conceptos relacionados pero distintos en el ámbito de la organización y clasificación del conocimiento. Todos estos términos provienen del ámbito de la organización y clasificación del conocimiento, especialmente en el campo de la informática y la ciencia de la información. Veamos sus diferencias:

1. Taxonomía: Una taxonomía es un sistema de clasificación jerárquica que organiza y agrupa elementos en categorías o niveles basados en características compartidas. La idea principal de una taxonomía es agrupar elementos similares y colocarlos en categorías más amplias y generales, lo que facilita la navegación y comprensión de una colección de datos o conceptos.

    Ejemplo de una taxonomía para animales:

    • Reino: Animalia
    • Filo: Chordata
    • Clase: Mammalia
    • Orden: Carnivora
    • Familia: Felidae
    • Género: Panthera
    • Especie: Panthera leo (León)

    En este ejemplo, la taxonomía clasifica al león en diversas categorías jerárquicas desde su reino hasta su especie, donde cada nivel representa una categoría más específica y única.

    2. Ontología: Una ontología es un modelo conceptual que describe las relaciones y propiedades entre los conceptos dentro de un dominio específico. Es un enfoque más formal y rico en términos de representación del conocimiento, y se utiliza para comprender y describir las relaciones semánticas entre las entidades de un dominio en particular.

      La ontología se basa en la lógica y la semántica, y permite establecer relaciones más complejas entre los conceptos que la mera clasificación jerárquica de una taxonomía. Las ontologías son ampliamente utilizadas en inteligencia artificial, web semántica y otras áreas donde es crucial tener una comprensión precisa de la estructura y el significado de los datos.

      Ejemplo de una ontología para un dominio de ventas:

      • Clase: Producto Propiedades: Nombre, Precio, Descripción, Categoría
      • Clase: Cliente Propiedades: Nombre, Dirección, Correo electrónico
      • Clase: Orden Propiedades: Fecha, Total, Tienda, Cliente Relaciones: Contiene_Producto (relación con clase Producto), Pertenece_a_Cliente (relación con clase Cliente)

      En este ejemplo, la ontología describe entidades como Producto, Cliente y Orden, junto con sus propiedades y relaciones, permitiendo un modelado más completo y semántico del dominio de ventas.

      3. La clasificación es un enfoque más general para organizar y categorizar elementos basados en criterios específicos. Puede incluir tanto taxonomías como ontologías, así como otros métodos de organización y clasificación, como etiquetado, palabras clave, etc. El propósito de una clasificación es organizar y hacer accesible el contenido o los datos de una manera que sea útil para los usuarios, permitiendo la búsqueda y recuperación de información de manera efectiva.

      En resumen, una taxonomía se enfoca en organizar elementos en categorías jerárquicas basadas en características compartidas, una ontología se centra en modelar las relaciones semánticas entre los conceptos en un dominio específico para una representación más rica y estructurada, mientras que un sistema de clasificación es un enfoque más general que puede incluir tanto taxonomías como ontologías, además de otros métodos de organización y clasificación.

      Taxonomías vs. Ontologías ¿En qué se diferencian las taxonomías y las ontologías?

      Hedden, Heather. «The Accidental Taxonomist: Taxonomies vs. Ontologies». The Accidental Taxonomist (blog), 31 de enero de 2023. https://accidental-taxonomist.blogspot.com/2023/01/taxonomies-vs-ontologies.html.

      A menudo surge la pregunta: ¿en qué se diferencian las taxonomías y las ontologías? Aunque hay algunas respuestas breves y sencillas (por ejemplo: las taxonomías son jerarquías y las ontologías son redes semánticas), es comprensible que la distinción no esté tan clara. Existe un solapamiento considerable. Las ontologías pueden contener taxonomías, y las taxonomías pueden enriquecerse semánticamente para convertirse en ontologías.

      Una de las tendencias en la gestión de datos/información/conocimiento es la convergencia de sistemas, métodos y tecnologías, incluida la convergencia de taxonomías y ontologías. Se ha llegado al punto de que algunas personas se refieren a las taxonomías y ontologías casi indistintamente, como si fueran esencialmente la misma cosa. No lo son, aunque cada vez se combinan más. Es interesante que uno de los canales de discusión más activos dentro de la comunidad  Taxonomy Talk community en Discord sea sobre ontologías.

      Usos

      Aunque tanto las taxonomías como las ontologías son tipos de sistemas de organización del conocimiento que facilitan el acceso a la información, sus usos específicos tienden a diferir. El uso principal de las taxonomías de la información es el etiquetado coherente y la recuperación precisa y completa de los elementos de contenido. Puede tratarse de documentos, componentes (secciones) de documentos, páginas web o de intranet, o activos digitales (archivos de imagen, audio, vídeo, etc.). Las ontologías, con su inclusión o vinculación a instancias/individuos, con sus diversos atributos, se centran más en lo específico de los datos: recuperación de datos, comparación de datos y análisis de datos. Las taxonomías sirven sobre todo para saber de qué trata un contenido (aunque los tipos de contenido/documento también pueden formar parte de la taxonomía), como en «consígueme todos los recursos de información sobre…», o «consígueme una lista de productos con…» y especificando como filtros el conjunto de características y el rango de precios. Las ontologías, por su parte, permiten consultas más complejas y de varios pasos, como «consígueme una lista de productos con…», un conjunto de características y un rango de precios, cuyos vendedores estén ubicados en Canadá y tengan unos ingresos anuales mínimos de 50 millones de dólares canadienses.

      Al comparar la recuperación de contenidos y datos, por ejemplo, las taxonomías pueden recuperar un archivo de hoja de cálculo, mientras que las ontologías pueden recuperar datos de celdas individuales de la hoja de cálculo. Las ontologías pueden recorrer los datos de una base de datos. Aunque puede tratarse de una base de datos relacional, las ontologías se utilizan cada vez más con bases de datos gráficas, ya que las ontologías también se estructuran como gráficos.

      Orígenes

      Otra diferencia importante entre taxonomías y ontologías es su origen. Las taxonomías de la información (no las biológicas) tienen su origen en la disciplina de la biblioteconomía. En concreto, yo diría que las taxonomías han evolucionado como una especie de híbrido flexible de sistemas de clasificación y tesauros. Las ontologías, por su parte, (cuando no en filosofía) tienden a enseñarse e investigarse como parte de la informática. Una vez más, también se ha producido una convergencia de la biblioteconomía y la informática en el campo de la ciencia de la información. No obstante, la biblioteconomía/informática y la informática/informática son enfoques diferentes.

      Las taxonomías también se han convertido en un área de interés en la arquitectura de la información, el diseño de la experiencia del usuario, la gestión de contenidos y la gestión de activos digitales. Las taxonomías también están relacionadas con la gestión terminológica y la búsqueda y recuperación de información. Las ontologías, por su parte, se han convertido en un área de interés en la ciencia de datos, la ingeniería de datos y la gestión de datos gráficos. Las ontologías también toman prestados conceptos de la teoría de conjuntos de las matemáticas y de la lógica de la filosofía.

      Las taxonomías y las ontologías siguen normas diferentes, pero también han convergido en cierto modo. Las taxonomías no tienen norma propia, pero siguen las normas de los tesauros (ANSI/NISO Z.39.19 e ISO 25964) para las mejores prácticas recomendadas. Las ontologías se basan en las normas RDF, RDF-Schema y el lenguaje formal OWL (Web Ontology Language) del W3C. El W3C publicó entonces una recomendación para taxonomías, tesauros y otros sistemas de organización del conocimiento llamada SKOS (Simple Knowledge Organization System) en 2009, y desde entonces ha sido ampliamente adoptada. SKOS se basa en RDF, al igual que los estándares ontológicos RSF-S. Como resultado, las declaraciones o namespaes SKOS y RDF-S pueden combinarse en el mismo sistema de organización del conocimiento, y las taxonomías y ontologías pueden así combinarse.

      Características

      Tanto las taxonomías como las ontologías pretenden describir un dominio de conocimiento con colecciones de entidades estructuradas en grupos o tipos, con relaciones entre ellas. Las ontologías van más allá y describen las relaciones con más detalle. Los atributos también son más amplios en las ontologías. Ambas admiten la opción de notas o definiciones.

      Conceptos o entidades

      Las taxonomías se componen de conceptos (a veces llamados términos), que son cosas. Los conceptos pueden ser genéricos o específicos, e incluso pueden incluir entidades con nombre (nombres propios únicos). Las taxonomías no distinguen entre conceptos genéricos y entidades con nombre, que corresponden a «individuos» en una ontología. Las ontologías, en cambio, distinguen entre dos tipos de entidades: clases e individuos. Las clases pueden ser amplias o específicas, pero, como su nombre indica, están destinadas a contener algo, ya sean subclases o individuos. En cambio, los nodos hoja (los conceptos más estrechos de una jerarquía) de una taxonomía pueden tener un significado bastante amplio.

      Los individuos, tal y como se definen en una ontología, tienden a ser entidades con nombre (nombres propios), y deben ser exclusivamente individuales. Esto puede no ser obvio. Un producto de marca es un nombre propio, pero técnicamente no es un individuo, porque hay numerosas instancias específicas del producto propiedad de diferentes personas. Puede haber diferencias de opinión sobre cómo definir a los individuos.

      Relaciones

      Las taxonomías siguen las normas del tesauro para las relaciones. Las relaciones jerárquicas de los tesauros son de tres tipos: genéricas-específicas o del tipo «es un», genéricas-instancia (cuando la instancia es una entidad con nombre o un nombre propio) y de parte entera. Las ontologías sólo tienen relaciones jerárquicas genéricas específicas «es un», que se dan entre clases y subclases. La relación entre un individuo y una clase no se considera jerárquica en una ontología, sino una relación de clase-miembro. Asimismo, la relación todo-parte no se considera jerárquica en las ontologías (pero podría crearse como relación semántica).

      Mientras que genérico-instancia es un tipo de relación jerárquica permitida en una taxonomía, los conceptos de entidad con nombre (nombres propios) no son tan a menudo más estrechos a un concepto genérico correspondiente, sino que más bien tienden a ser agrupados en su propio esquema de concepto separado para servir como una faceta de búsqueda separada o filtro.

      En las taxonomías puede existir una relación genérica asociativa («relacionada»), aunque es más propia de los tesauros. Es bidireccional y recíproca, y suele utilizarse entre conceptos de un mismo esquema conceptual, que suele corresponder a una clase de una ontología. Las ontologías no tienen una relación asociativa genérica. En su lugar, las ontologías tienen relaciones semánticas que son designadas por el creador de la ontología, al igual que se designan las clases, y no se utilizan dentro de las clases, sino a través de un par específico de clases. Las sugerencias sobre lo que podría ser de interés relacionado para el usuario final no entran en el ámbito de la finalidad de una ontología, que es más estructurada y se basa en reglas. Las ontologías pueden tener otras relaciones recíprocas bidireccionales, como «va con», «tiene hermano», «acompaña», etc.

      Equivalencia y etiquetas alternativas

      En una taxonomía, cada concepto tiene una única etiqueta preferida en cada idioma para su visualización y cualquier número de etiquetas alternativas y etiquetas ocultas por idioma para ayudar a la equivalencia en la búsqueda o el etiquetado. En el modelo tradicional de tesauro, los términos «no preferidos» se redirigen a términos «preferidos». Las etiquetas alternativas son suficientemente equivalentes en el contexto de la taxonomía y el contenido para ser utilizadas para un concepto determinado, por lo que pueden no ser sinónimos exactos. Las etiquetas alternativas incluyen sinónimos, casi sinónimos y, posiblemente, incluso términos más restringidos que no se consideran necesarios como conceptos con etiquetas preferidas.

      En las ontologías, el elemento OWL sameAs está pensado para la equivalencia de individuos, y equivalentClass para la equivalencia de clases, y significan equivalencia exacta. Pero no se designa un nombre como preferido y el otro como alternativo. Todos son preferibles. El uso de sameAs y equivalentClass no está pensado para su uso dentro de una única ontología, sino entre diferentes ontologías. Por lo tanto, estos elementos OWL son similares a la relación exactMatch de SKOS, que se utiliza en diferentes esquemas conceptuales o taxonomías. No permiten la búsqueda dentro del mismo conjunto de datos, como sí lo hacen las etiquetas alternativas.

      Aplicación de reglas

      SKOS es un modelo de datos para taxonomías y tesauros, pero no especifica ninguna regla de uso. Más bien, el creador de la taxonomía debe intentar seguir las directrices, no exactamente las reglas, de las normas de los tesauros (ANSI/NISO Z39.19 e ISO 25964-1). Las normas de calidad incluyen etiquetas disjuntas (una etiqueta sólo puede utilizarse una vez para un concepto, preferido o alternativo, y para un solo concepto), relaciones simples (un par de conceptos puede tener relaciones jerárquicas o asociativas entre sí, pero no ambas) y ausencia de ciclos jerárquicos. En cambio, el estándar para ontologías, OWL, tiene muchas reglas incorporadas. Esto hace que las ontologías OWL sean más potentes al permitir inferencias y razonamientos.

      Conclusiones

      Las taxonomías y las ontologías comparten algunas características, pero cada una tiene las suyas propias. Así, la combinación de una taxonomía SKOS con una ontología OWL combina las características de ambas. Además, la combinación de una taxonomía con una ontología permite también una combinación de usos, a saber, la búsqueda y recuperación conjunta de contenidos y datos. Más que una convergencia de taxonomías y ontologías, éstas se combinan cuidadosa y deliberadamente para maximizar sus ventajas.