Archivo de la etiqueta: Etiquetado social

El futuro de los algoritmos y el etiquetado colaborativo (folksonomías) en las bibliotecas

The Future of Algorithms and Collaborative Tagging in Our Libraries
Editor’s note: This is a guest post by Jessica Luna. Hack Library School, 2022

Texto completo

La folcsonomía es el proceso de utilizar etiquetas de contenidos digitales para su categorización o anotación. Permite a los usuarios clasificar sitios web, imágenes, documentos y otras formas de datos para que el contenido pueda ser fácilmente categorizado y localizado por los usuarios.

La búsqueda se ha convertido en un hilo conductor la vida diaria. El aprendizaje de métodos básicos y avanzados de búsqueda de diferentes tipos de información, la evaluación de los resultados de la búsqueda y la comprensión de cómo los algoritmos dan forma a nuestras consultas son sólo algunas de las cosas a tener en cuenta. Y son esos algoritmos los que han dominado nuestras vidas desde antes de la existencia de la Web 2.0.

Los métodos de recuperación de información personalizada (PIR) mediante el etiquetado colaborativo, también conocido como folcsonomías. El etiquetado colaborativo está cada vez más arraigado en los sistemas bibliotecarios en línea de última generación porque resulta familiar y cómodo para los usuarios navegar y descubrir materiales etiquetados de forma similar. La personalización se ha convertido en un factor esencial en la configuración de las folcsonomías actuales.

Las folcsonomías se utilizan en sitios web de redes sociales como Flickr, Twitter e Instagram para ayudar a los usuarios a buscar temas de su interés. Los creadores de contenidos en plataformas como YouTube y Twitch utilizan las folcsonomías para que sus contenidos sean más buscables y lleguen a un público más amplio. Esto nos hace plantearnos si los modelos de recomendación PIR son el futuro de los catálogos de las bibliotecas de nueva generación.

¿Cómo funciona?

El modelo básico actual de sistema de folcsonomía contiene tres variables esenciales: usuarios, recursos y etiquetas. Estas tres variables constituyen la base para calcular el peso y la clasificación de las etiquetas en diversos sistemas de etiquetado. Los modelos PIR utilizan los perfiles de los usuarios y de los recursos para personalizar su experiencia de búsqueda en función de sus intereses. El objetivo es identificar la respuesta más cercana a la necesidad de una persona en función de las características de su cuenta de usuario.

Una parte importante de los modelos PIR para folksonomías son los sistemas de recomendación. Hay muchas investigaciones sobre diferentes métodos PIR que pueden cambiar drásticamente la forma de clasificar los documentos y las etiquetas que se recomiendan a los usuarios. Algunos sistemas de recomendación PIR reconocen que el comportamiento de etiquetado de los usuarios suele cambiar con el tiempo, por lo que el sistema ideal debería tener en cuenta el comportamiento de etiquetado histórico de un usuario a la hora de evaluar el peso y la clasificación de un recurso etiquetado. Otros algoritmos exploran la relación entre la relevancia de la consulta y la relevancia del interés del usuario. La teoría sugiere que cuantas más veces utiliza un usuario una etiqueta en su perfil, más interesado está en su tema.

El análisis de sentimientos es una forma de que el aprendizaje automático extraiga los intereses y sentimientos de los usuarios basándose en los temas que siguen y en las etiquetas que han buscado en el pasado. Aplica evaluaciones de similitud para crear una mayor precisión de los recursos recuperados. Los algoritmos generan relaciones entre palabras y frases, categorizando las relaciones semánticas entre frases y oraciones. Los términos se clasifican dentro de un espacio vectorial, y los que tienen mayor puntuación tienen más peso a la hora de representar un tema.

Problemas de personalización

Una queja común sobre los sistemas PIR es la privacidad. La personalización sólo puede producirse obteniendo datos del usuario, a menudo sin su conocimiento o consentimiento.

Los sistemas de recomendación pueden forzar a los usuarios a entrar en burbujas de filtros. Estos sistemas aíslan a los usuarios de otras perspectivas y visiones del mundo, perpetuando la ignorancia de la gente sobre creencias y culturas alternativas. Es esencialmente otro tipo de censura que estrecha la percepción de una persona. Por suerte, se han desarrollado otros métodos para diversificar las recomendaciones del PIR.

Mirando hacia el futuro

Los estudios PIR proporcionan una idea de cómo los algoritmos clasifican y ponderan las folksonomías. También nos permite suponer cómo las empresas privadas podrían utilizar métodos similares a la hora de sugerir recursos a los usuarios. Twitter me viene a la mente cuando pienso en los modelos PIR utilizados con las folcsonomías. Cuando interactúas suficientes veces con otro usuario o con un hashtag concreto, el algoritmo añade usuarios y hashtags similares a tu feed.

Hablamos de Twitter porque ha sido noticia últimamente. Para promover la transparencia del algoritmo, Elon Musk declaró en una reciente charla TED sus intenciones de hacer que Twitter sea de código abierto. Será nuestro primer vistazo al análisis crítico de los algoritmos de una plataforma de medios sociales y a una mayor investigación sobre los sistemas PIR.

Al convertirse los algoritmos de Twitter en código abierto, es posible que veamos más estudios sobre cómo los sistemas PIR dan forma a las experiencias de los usuarios. También abre la puerta a nuevas investigaciones sobre las implicaciones éticas de los sistemas PIR y sus posibles soluciones.

Por el momento, no hemos encontrado ningún catálogo de nueva generación que utilice métodos PIR para las folcsonomías. Los ILS/LSP suelen utilizar etiquetas como facetas en su catálogo. Koha tiene una nube de etiquetas que muestra las etiquetas más utilizadas. La adición de medidas de análisis de sentimiento podría resultar fructífera para identificar las similitudes entre las etiquetas. Las etiquetas que podrían considerarse molestas y subjetivas tendrían ahora un significado.

No está claro si algún ILS/LSP incluirá algún día métodos PIR en sus sistemas, pero es bueno saber cómo funcionan.

Donde viven las etiquetas: el etiquetado en los blogs de literatura infantil y juvenil

1 respuesta

García Rodríguez, A., Gómez Díaz, R., Cordón García, J.A., Alonso Arévalo, J. (2014, diciembre). Donde viven las etiquetas : el etiquetado en los blogs de literatura infantil y juvenil. BiD: textos universitaris de biblioteconomia i documentació, 33.

Texto completo

Con el objetivo de analizar las prácticas del etiquetado en los blogs de literatura infantil y juvenil, se recopila un conjunto de blogs especializados y pertenecientes a diferentes categorías y se estudia cómo es el etiquetado. Entre otras variables, se analiza la ubicación de las etiquetas, la forma de presentación, el tipo de etiquetas más utilizadas, etc. Los datos analizados ponen de manifiesto que el etiquetado es una práctica cada vez más habitual en los blogs como recurso para organizar los contenidos y para recuperar la gran cantidad de información que estos generan. Además de aportar el análisis de las prácticas del etiquetado, se da una serie de recomendaciones para mejorar la asignación de etiquetas y favorecer la visibilidad de la información de este tipo de blogs.

Entre las herramientas de la LIJ 2.0 por su sencillez, economía y facilidad de difusión, los blogs se han convertido en el escaparate del género, en un lugar en el que esos autores «invisibles» que escriben para niños y jóvenes consiguen que se hable de sus títulos y se hacen visibles.

«Donde viven los monstruos» es un libro infantil escrito e ilustrado por Maurice Sendak.

Leer un blog es una actividad consolidada, como lo demuestran los últimos datos sobre hábitos de lectura y compra de libros realizados por la Federación de Gremios de Editores de España (2012), que confirman que entre la población mayor de 14 años, el 46,9 % lee webs, blogs y foros, con una frecuencia al menos trimestral, un porcentaje que aumenta hasta el 77,9 % en la población de entre 14 y 24 años. En cuanto a la población de 10 a 13 años, el 40,7 % lee con frecuencia, al menos trimestral, webs, foros y blogs, y el 13,3 % participa en blogs y foros de cualquier tipo.

Las etiquetas son palabras del vocabulario que utiliza el usuario común, es decir, palabras sin ningún tipo de control terminológico que representan un contenido determinado (Gómez Díaz, 2012). Su finalidad es facilitar la recuperación del objeto al cual describen, por tanto, si están bien asignadas, aportan una valiosísima información sobre los términos, ya que representan, con el lenguaje del autor de la entrada del blog, el contenido. El problema es que en muchas ocasiones se pierde como punto de referencia que esa etiqueta sirve para la localización y recuperación de los contenidos del blog, y el resultado es un conjunto de etiquetas que, aunque describan el contenido, lo hacen de manera tan genérica que son muchas las entradas que utilizan la misma etiqueta, y por tanto el valor de discriminación de unos contenidos frente a otros se pierde. También puede suceder que la etiqueta solo tenga sentido para el autor que la asigna y no para los usuarios. Incluso puede ser ambigua porque represente varias realidades, o que la misma realidad sea representada con varias etiquetas, de manera que los contenidos que deberían mantenerse agrupados bajo la misma etiqueta aparezcan disgregados.

Tal y como afirman García y Rubio (2013, p. 65), «La utilización de las herramientas de la web 2.0, entre ellas los blogs, ha favorecido una mayor presencia de la LIJ en Internet y ha dado voz a una disciplina que, hasta no hace mucho, permanecía en la más absoluta invisibilidad. Internet se ha convertido en un espacio para intercambiar opiniones, promocionar y dar a conocer proyectos y experiencias, recomendar libros, fomentar la lectura…, un lugar en el que participan todos los agentes relacionados con el ámbito de los libros infantiles y juveniles, escritores, ilustradores, bibliotecarios, padres, maestros, editores, libreros y por supuesto, lectores».

Leer en un blog es una actividad consolidada entre niños y adultos, lo que ha dado lugar a que estos se hayan convertido en prescriptores de LIJ, en líderes de opinión sobre lecturas y en un recurso cada vez más utilizado para buscar información, de ahí la importancia de arbitrar mecanismos que favorezcan la recuperación de los contenidos, como hacen las etiquetas.

Dentro de los blogs, al igual que en el resto de las herramientas de la web social, el etiquetado se está convirtiendo en una práctica cada vez más habitual para organizar los contenidos, y como recurso por excelencia para recuperar la cada vez mayor cantidad de información que estos generan.

La asignación de etiquetas es común en los blogs de LIJ y también es frecuente que estas cumplan su función y aparezcan claramente visibles en las diferentes entradas. Sin embargo, la presentación de las etiquetas en el blog en forma de nube o lista no es tan usual según los ejemplos analizados.

La elección de los tipos de etiquetas cumple la función esencial de los blogs especializados, la reseña y recomendación de libros y la difusión de autores, ilustradores y títulos, de ahí que sean mayoritariamente utilizadas las referidas a autoría, contenido, género y materia.

Sin embargo, los administradores de los blogs no parecen preocuparse demasiado por evitar prácticas que en ocasiones pueden dificultar la recuperación de la información y la visibilidad de los términos en la nube, como pueden ser el uso indiscriminado de sinónimos, la utilización de diferentes lenguas para asignar las mismas etiquetas, errores tipográficos y ortográficos o las variadas formas de presentar los sintagmas nominales.

Aunque este tema no sea objeto de este trabajo, hay que tener en cuenta que el etiquetado sirve también para la recuperación no solo desde el propio blog, que es lo que se ha analizado aquí, sino que además es utilizado por los motores de búsqueda para la recuperación desde los buscadores.

El etiquetado tiene grandes posibilidades cara a la recuperación de la información y a potenciar la visibilidad, es conveniente realizarlo con cierto cuidado. Aunque es una práctica que no está normalizada, el uso de unas sencillas recomendaciones puede potenciar su utilidad.

Para ello, proponemos una serie de buenas prácticas que ayudarán al etiquetado en los blogs.

Evitar etiquetas que solo encajen con un contenido, ya que los buscadores entenderán que tanto la página como el post de la etiqueta son un contenido duplicado y no se recuperará bien. Es recomendable que cada etiqueta se asocie a varias entradas.
Evitar que las etiquetas sirvan para muchos contenidos, ya que esto provocará que la etiqueta pierda su valor de discriminación y el usuario tendrá dificultad para encontrar lo que busca.
Adaptar la especificidad de la etiqueta al tipo de blog. Por ejemplo, en un blog sobre literatura infantil la etiqueta libros para niños es muy genérica, mientras que puede ser específica en un blog de literatura en general, independiente del número de entradas con las que coincida.
No abusar del número de etiquetas asociadas a cada entrada, generalmente 4 o 5 suelen ser suficientes. A medida que aumenta el número de etiquetas es más fácil dispersar el contenido.
Utilizar siempre las palabras de la misma manera, en singular o en plural, porque, si no, el lector se verá obligado a buscar lo mismo en varias etiquetas.
Incluir una lista de etiquetas o una nube para que los usuarios sepan las que se han utilizado.
Poner la lista o la nube en un lugar bien visible, preferentemente en uno de los márgenes laterales, en la parte superior.
Indicar cuántos posts tiene cada etiqueta para que los usuarios conozcan los temas habituales del blog.

Leer completo

Lectura social, Plataformas, nubes y etiquetas

1 respuesta

Social Reading: Platforms, applications, clouds and tags / José-Antonio Cordón-García, Julio Alonso-Arévalo, Raquel Gómez-Díaz and Daniel Linder, University of Salamanca, Spain. Chandos Publishing Social Media Series No. 10.

ISBN 1 84334 726 1
ISBN-13: 978 1 84334 726 2
October 2013
310 pages 234 x 156mm paperback – See more at: http://www.woodheadpublishing.com/en/book.aspx?bookID=2869&ChandosTitle=1#sthash.q2gLx2x4.dpuf

Normalmente se envía en 24 horas

El siglo XXI se caracteriza por la progresiva influencia de los contenidos digitales y por una porosidad cada vez mayor entre el universo electrónico y el real. Vivimos en un mundo de pantallas, las del ordenador, las del móvil, las de los e-reader, las de las tablets, cuya fundamento es la información, y aquellos que mejor sepan buscarla, manejarla, gestionarla, aprovecharla e interpretarla, estarán en mejores condiciones para afrontar los retos personales, laborales y sociales de un mundo conectado y globalizado. Las competencias y habilidades en el uso de la información digital, forman parte de cualquier curriculum formativo, y así lo han entendido las autoridades educativas, a nivel internacional y nacional, estableciendo estándares obligatorios para su desarrollo. La práctica laboral o el desempeño de puestos de trabajo de muy diversa índole, nos enfrentan igualmente a necesidades informativas de todo tipo que es preciso satisfacer para incrementar el rendimiento y la eficiencia en el mismo. Incluso las actividades más lúdicas, como las relacionadas con el uso de las redes sociales, están impregnadas de un sustrato informativo cuyo conocimiento favorece un aprovechamiento óptimo de las mismas. La respuesta a estas necesidades pasa por un conocimiento adecuado de las distintas Fuentes de Información existentes. Fuentes que han ido asimilando los cambios que los procesos de comunicación han experimentado con el desarrollo de tecnologías que las han ido convirtiendo en más versátiles, más dinámicas y más abiertas. Libros Electrónicos, Revistas electrónicas, Repositorios, Enciclopedias, Bases de datos Bibliográficas, Fuentes de Información Terminológicas, Software Libre, Sistemas de Sindicación de Contenidos, Gestores de Referencia Social,Indices de Citas, Sistemas de búsqueda para la acreditación y reputación on line, etc constituyen un elenco de Fuentes en unos casos nuevas en otros renovadas que participan de la filosofía 2.0 y están especialmente diseñadas para favorecer el uso y asimilación de las competencias digitales que exige la Sociedad del Conocimiento. Este libro las aborda desde una perspectiva didáctica con el fin de acercarlas a todo tipo de lectores.

	Noticias IA y Educac… en Aprender para el futuro: educa…
	IA en bibliotecas: d… en Implementación de un chatbot d…
	IA en bibliotecas: d… en Declaración de la IFLA sobre d…
	IA en bibliotecas: d… en Principios Rectores de las Bib…
	IA en bibliotecas: d… en Competencias en IA para trabaj…