En qué se diferencian las taxonomías de las ontologías

How Taxonomies Differ From Ontologies
Data Science Central. Posted by Kurt Cagle on November 19, 2020 at 7:42pm

Texto completo

A lo largo de los años, la gente me ha preguntado en qué se diferencia una taxonomía de una ontología. La respuesta (o al menos una respuesta razonablemente simple) es que “una taxonomía es una ontología en forma de árbol”.

Sin embargo, vale la pena profundizar un poco más para entender lo que eso significa:

A principios del siglo XVIII, un biólogo sueco llamado Carl Linnaeus comenzó un proyecto bastante ambicioso. Quería construir una forma de indexar los animales y plantas por sus fenotipos, las formas en que se parecen. Su taxonomía original era bastante básica, pero en el transcurso de décadas, creó un sistema con unos pocos miles de entidades vivas. Utilizó la palabra francesa Taxonomía, derivada del término griego para la clasificación de los conocimientos, y la Taxonomía de Linneo continuaría para provocar una revolución en la biología a medida que generaciones de científicos encajaran nuevas especies en ella.

Este es el tipo de taxonomía del que la mayoría de la gente es inmediatamente consciente, principalmente por su organización arbórea. Los términos más generales se ubicaban hacia la raíz del árbol, luego en cada rama (nodo) Linneo puso especies más detalladas:

Animales => Vertebrados => Mamíferos => Carnívoros => Animales parecidos a los gatos => Gatos domésticos.

La teoría detrás de esta organización era que los animales eran más especializados cuanto más avanzados estaban (cuanto más lejos del tronco). No es sorprendente que fuera uno de los fundamentos de la selección natural, aunque este modelo era bastante primitivo. El árbol también establecía un sistema de clasificación de la especificidad, en el que cada grado del árbol indicaba más especificidad hasta que se chocaban las hojas, que contenían las especies asociadas.

Esta taxonomía es importante porque contiene tanto los términos de interés – Carnívoros, por ejemplo – como un conjunto de reglas generales que indican cómo se relacionan los términos entre sí. Hay taxonomías similares – el Sistema Decimal Dewey o el más reciente esquema organizativo de la Biblioteca del Congreso, que de manera similar desglosa las ramas generales de conocimiento o entendimiento en un esquema o conjunto particular.

Los esquemas de clasificación son de particular importancia tanto para la programación como para la inteligencia artificial. La mayoría de los objetos, cuando se llega al fondo, pueden ser pensados como listas de propiedades atómicas (como la longitud) y propiedades categóricas (como los colores o las texturas) – o de estructuras compuestas que pueden ser igualmente desglosadas (como la dirección de una casa). Una propiedad categórica determinada puede pensarse como una lista de cadenas, aunque semánticamente, esas listas pueden ser entidades por derecho propio. En XML y JSON. (Por ejemplo, una lista de Estados de los Estados Unidos o provincias del Canadá se consideran enumeraciones o valores categóricos, pero cada estado o provincia puede tener también información adicional, como la fecha de fundación o la población en un momento determinado.

La ontología como materia general significa el estudio de las cosas (logos griegos + ontos). Como concepto matemático, una ontología es la colección de los términos o conceptos en el ámbito de la ontología más el modelo que describe las relaciones y limitaciones de esos conceptos Las ontologías suelen expresarse matemáticamente en forma de gráficos, con el concepto de que un gráfico podría (aunque no tiene por qué) crear un bucle cerrado. Estos gráficos también son direccionales. Los matemáticos se referirían a ellos como Gráficos Cíclicos Dirigidos (DCG).

Una taxonomía es, en general, un Gráfico Acíclico Dirigido (DAG), lo que significa que no hay bucles posibles en el gráfico. Los DAG también se conocen como árboles. Además, tanto los DAG como los DCG pueden ser etiquetados – cada nodo y borde puede tener un identificador específico.

La mayoría de las taxonomías tienden a ser de naturaleza arbórea, trabajando desde una raíz muy general hasta hojas muy especializadas. Por consiguiente, son gráficos acíclicos, o DAGs. Una ontología es más generalizada (se pueden tener bucles dentro del gráfico de una ontología), y como tal son DCGs. Lo importante es darse cuenta de que todos los DAG son subconjuntos de DCG. Esto significa dos cosas: primero, una taxonomía es una ontología, segundo, no todas las ontologías pueden ser representadas como taxonomías sin introducir el concepto de referencia.

En cualquier taxonomía moderna, cada nodo en el gráfico debe ser identificado por una dirección única o GUID de algún tipo. En el lenguaje de las bases de datos, esto es lo que se conoce como clave primaria. Si otro nodo tiene una conexión o borde que tiene el valor de esta clave, se dice que este nodo tiene una referencia a la clave (o tiene una relación de clave externa). Una tabla de una base de datos relacional debe tener (si se diseña adecuadamente) al menos una clave primaria, pero puede tener múltiples referencias de clave externa. Si no se crea un bucle, se dice que la base de datos es acíclica. En una base de datos relacional, el motor de la base de datos rechazará activamente cualquier bucle que se cree, por lo que una base de datos relacional en teoría también debería ser un DAG.

Irónicamente, un documento XML, un documento JSON o un conjunto de triples RDF pueden tener relaciones que forman gráficos cíclicos. Sin embargo, una vez que esto sucede, ya no son como los árboles. En términos taxonómicos, esto sería como añadir una relación “Ver también” que conectaría Gato con Perro. La mayoría de las taxonomías que son estrictamente arbóreas también tienen la misma relación que se extiende en ese árbol, como Gato “es más especializado que” Carnívoro, Carnívoro es más especializado que Mamífero y así sucesivamente. (Los matemáticos dirían que el gráfico tiene un cierre transitivo sobre la propiedad “es más especializado que”.

Por lo tanto, una buena definición de trabajo es que una taxonomía es una ontología que es (en su mayor parte) un gráfico acíclico dirigido con un solo cierre transitivo que contiene todos los nodos de ese gráfico. Ante los ojos de la persona con la que estás hablando, puedes ponerlo de forma más simple como “una taxonomía es una ontología en forma de árbol”.