Archivo de la etiqueta: Wikipedia

Humanidades digitales y Wikipedia. Planeta Biblioteca 202005/27.

 

fd0a803587d0721b99a141b67284d620

Ir a descargar

 

En esta ocasión hemos entrevistado a Iván Hernández Cazorla. Historiador que ha desarrollado su trayectoria profesional en torno a las Humanidades digitales y patrimonio cultural, y en en relación con el movimiento Wikimedia, Wikipedia, Wikidata ha trabajado en el proyecto Wikidata-IATEXT que consistió en la curación y estructuración de datos relacionados con los miembros del Instituto de Análisis y Aplicaciones Textuales (IATEXT) del «instituto universitario de la ULPGC

Fotografía:

Archivo: Wikidata Days 2019 – NOVA SBE, Carcavelos – IMG 20190607 133128.jpg. Licencia

Papel de los bots en la Wikipedia

 

wikipediabots

 

Lei (Nico) Zheng, Christopher M. Albano, Neev M. Vora, Feng Mai, and Jeffrey V. Nickerson. 2019. The Roles Bots Play in Wikipedia. Proc. ACM Hum.-Comput. Interact. 3, CSCW, Article 215 (November 2019), 20 pages. https://doi.org/10.1145/3359317

Texto completo

 

Si bien todos podemos aprender de los 40 millones de artículos de Wikipedia, los constructores de bots de gestión específicamente pueden obtener una educación significativa al estudiar la creación, investigación y roles de los 1.601 bots que ayudan a mantener el sitio e interactuar con sus más de 137,000 editores humanos.

Cada bot realiza un trabajo único: algunos generan artículos basados ​​en plantillas; algunos arreglan errores tipográficos, errores ortográficos y errores en enlaces; algunos identifican spam, vándalos o infracciones de políticas; algunos interactúan con humanos saludando a los recién llegados, enviando notificaciones o proporcionando sugerencias.

Los bots juegan un papel cada vez más importante en la creación de conocimiento en Wikipedia. En muchos casos, los editores y los bots forman equipos muy unidos. Los humanos desarrollan bots, solicitan su aprobación y los mantienen, realizando tareas como monitorear la actividad, fusionar bots similares, dividir bots complejos y desactivar bots que no funcionan correctamente.

Los investigadores del Instituto de Tecnología Stevens clasificaron los bots de Wikipedia en nueve roles y 25 funciones asociadas con el objetivo de comprender qué hacen los bots ahora y qué podrían hacer en el futuro. Jeffrey Nickerson, profesor y decano asociado de investigación en la Escuela de Negocios de Stevens, y autor de “The Roles Bots Play en Wikipedia“, publicado en noviembre de 2019, comparó la clasificación con la forma en que los humanos hablan sobre ocupaciones y profesiones, las habilidades requeridas para hacerlos y las tareas que se deben realizar.

Otra característica de los bots de Wikipedia es cómo funcionan con los editores humanos. A menudo, los editores crean un bot para automatizar algunos de sus procesos de edición, dijo Nickerson. Una vez que lo construyen, lo sueltan y lo revisan periódicamente. Eso libera a los editores para hacer el trabajo que más les interesa, pero también se convierten en mantenedores de bots.

¿Qué es tendencia en Wikipedia?

 

gnex-wikipedia-50-1020

 

Volodymyr Miz : Joëlle Hanna
Nicolas Aspert ; Benjamin Ricaud ;
Pierre Vandergheynst. What is Trending on Wikipedia? Capturing Trends and Language Biases Across Wikipedia Editions. Arxiv, 2020.

Texto completo

 

En este trabajo, se propone una evaluación automática y una comparación del comportamiento de navegación de los lectores de Wikipedia que se puede aplicar a las ediciones de Wikipedia en cualquier idioma. Como ejemplo, se centra en los idiomas inglés, francés y ruso durante los últimos cuatro meses de 2018.

El método propuesto tiene tres pasos. En primer lugar, extrae los artículos más populares durante un período de tiempo elegido. En segundo lugar, realiza una extracción de tema semi-supervisado y, en tercer lugar, compara los temas entre idiomas. El procesamiento automatizado funciona con los datos que combinan el gráfico de hipervínculos de Wikipedia, estadísticas de páginas vistas y resúmenes de las páginas.

 

72349e68000e4a7bbf56d695be1d7f66

 

Los resultados muestran que las personas comparten un interés común y curiosidad por el entretenimiento, por ejemplo, películas, música, deportes independientemente de su idioma. Las diferencias aparecen en temas relacionados con eventos locales o sobre particularidades culturales.

 

Investigadores del MIT desarrollan un sistema automatizado que puede reescribir frases obsoletas en los artículos de Wikipedia

 

wikipediabotsfeature

 

Darsh J Shah, Tal Schuster, Regina Barzilay. Automatic Fact-guided Sentence Modification. AAAI 2020

Texto completo

Mit News

 

Un sistema creado por los investigadores del MIT podría utilizarse para actualizar automáticamente las inconsistencias de los hechos en los artículos de la Wikipedia, reduciendo el tiempo y el esfuerzo de los editores humanos que ahora hacen la tarea manualmente.

 

En un documento que se presenta en la Conferencia de la AAAI sobre Inteligencia Artificial, los investigadores describen un sistema de generación de texto que señala y reemplaza información específica en frases relevantes de Wikipedia, manteniendo el lenguaje similar a la forma en que los humanos escriben y editan.

La idea es que los humanos escriban en una interfaz una oración no estructurada con información actualizada, sin necesidad de preocuparse por el estilo o la gramática. El sistema entonces buscaría en Wikipedia, localizaría la página apropiada y la oración obsoleta, y la reescribiría de manera similar a la de los humanos. En el futuro, dicen los investigadores, existe la posibilidad de construir un sistema totalmente automatizado que identifique y utilice la información más reciente de toda la web para producir frases reescritas en los artículos correspondientes de Wikipedia que reflejen la información actualizada.

“Hay tantas actualizaciones que se necesitan constantemente para los artículos de Wikipedia. Sería beneficioso modificar automáticamente porciones exactas de los artículos, con poca o ninguna intervención humana”, dice Darsh Shah, un estudiante de doctorado en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y uno de los autores principales. “En lugar de cientos de personas trabajando en la modificación de cada artículo de la Wikipedia, entonces sólo se necesitará unos pocos, porque el modelo está ayudando o lo hace automáticamente. Eso ofrece mejoras importantes respecto a la eficiencia.”

Existen muchos otros bots que hacen ediciones automáticas de Wikipedia. Típicamente, esos trabajan en la mitigación del vandalismo o en coordinar alguna información estrechamente definida en plantillas predefinidas, dice Shah. El modelo de los investigadores, dice, resuelve un problema más difícil de inteligencia artificial: Dada una nueva pieza de información no estructurada, el modelo modifica automáticamente la frase de manera humana. “Las otras tareas [bot] se basan más en reglas, mientras que ésta es una tarea que requiere razonar sobre partes contradictorias en dos frases y generar un texto coherente”, dice.

El sistema también puede ser usado para otras aplicaciones de generación de texto, dice el co-autor principal y estudiante graduado de CSAIL, Tal Schuster. En su trabajo, los investigadores también lo usaron para sintetizar automáticamente las oraciones en un popular conjunto de datos de verificación de hechos que ayudaron a reducir el sesgo, sin tener que recolectar manualmente datos adicionales. “De esta manera, el rendimiento mejora para los modelos de verificación automática de hechos en el conjunto de datos para, por ejemplo, la detección de noticias falsas”, dice Schuster.

 

Ciencia a través de Wikipedia: una representación novedosa del conocimiento abierto a través de redes de co-citas

 

20130504_blp510

 

Arroyo-Machado, Wenceslao ; Torres-Salinas, Daniel; Herrera-Viedma, Enrique ; Romero-Frías, Esteban. Science Through Wikipedia: A Novel Representation of Open Knowledge Through Co-Citation Networks. PLoS ONE. DOI: https://doi.org/10.1371/journal.pone.0228713

Texto completo

 

Este estudio proporciona una visión general de la ciencia desde la perspectiva de Wikipedia. Se estableció una metodología para el análisis de cómo los editores de Wikipedia consideran la ciencia a través de sus referencias a artículos científicos.

El método de co-citación se ha adaptado a este contexto para generar redes Pathfinder (PFNET) que resalten las revistas y categorías científicas más relevantes, y sus interacciones para descubrir cómo se consume la literatura científica a través de esta enciclopedia abierta. Además de esto, su obsolescencia ha sido estudiada a través del índice de precios.

Inicialmente se ha tenido en cuenta un total de 1 433 457 referencias disponibles en  Altmetric.com . Después de preprocesarlos y vincularlos a los datos de CiteScore Metrics de Elsevier, la muestra se redujo a 847 512 referencias hechas por 193.802 artículos de Wikipedia a 598.746 artículos científicos pertenecientes a 14 149 revistas indexadas en Scopus.

Como resultados resaltados, se encontró una presencia significativa de artículos de “Medicina” y “Bioquímica, Genética y Biología Molecular” y que las revistas más importantes son de naturaleza multidisciplinaria, lo que sugiere también que las revistas de factores de alto impacto tenían más probabilidades de ser citadas. Además, solo el 13.44% de las citas de Wikipedia corresponden a revistas de acceso abierto.

Papel de los bots en la Wikipedia

 

bots-wikipedia-670x335

 

Zheng Stevens, Christopher M. Albano. The Roles Bots Play en Wikipedia. ACM, 2019

Texto completo

Los bots juegan un papel cada vez más importante en la creación de contenidos en Wikipedia. En muchos casos, los editores y los bots forman equipos muy unidos. Los humanos desarrollan bots, solicitan su aprobación y los mantienen, realizando tareas como monitorear la actividad, fusionando bots similares, dividiendo bots complejos y desactivando bots que funcionan mal. Sin embargo, esta no es la imagen completa. Los bots están diseñados para realizar ciertas funciones y pueden adquirir una nueva funcionalidad con el tiempo. Desempeñan papeles particulares en el proceso de edición. Comprender estos roles es un paso importante para comprender el ecosistema y diseñar mejores bots e interfaces entre bots y humanos. Esto es importante para comprender Wikipedia junto con otros tipos de trabajo en los que las máquinas autónomas afectan las tareas realizadas por humanos.

Wikipedia integra vistas previas de libros digitales para ayudar a verificar citas

wikipedia-ia

Internet Archive y Wikipedia se unen para ayudar a los usuarios a verificar las citas mostrando la vista previa del libro citado, lo que facilita encontrar y verificar esas fuentes de texto tradicionales en línea. Internet Archive ya ha convertido 130.000 referencias de libros en Wikipedia en enlaces a 50,000 libros digitalizados.

Por ejemplo, el artículo de Wikipedia sobre Martin Luther King, Jr cita el libro To Redeem the Soul of America, de Adam Fairclough. Esa cita ahora enlaza directamente con la página 299 dentro de la versión digital del libro proporcionada por Internet Archive. Hay 66 libros citados y vinculados en ese artículo solo.

Los lectores pueden ver un par de páginas para obtener una vista previa del libro y, si quieren leer más, pueden tomar prestada la copia digital utilizando préstamos digitales controlados de una manera similar a cómo toman prestados libros físicos de su biblioteca local.

 

Libro Blanco de la ARL sobre Wikidata: Oportunidades y recomendaciones

 

wd

White Paper on Wikidata: Opportunities and Recommendations. Washington D. C., : ARL, 2019

Texto completo

 

En este libro blanco de la Asociación de Bibliotecas de Investigación, un grupo de trabajo de usuarios expertos de Wikidata recomienda una variedad de formas para que los bibliotecarios utilicen la base de conocimiento abierto para avanzar en el descubrimiento global de sus colecciones, investigación e instituciones. Más allá del grupo de trabajo, muchos profesionales bibliotecarios de dentro y fuera de la comunidad de Wikimedia contribuyeron al libro blanco en forma de borrador, ofreciendo una mezcla productiva de entusiasmo y escepticismo que mejoró el producto final. La ARL convocó al grupo de trabajo y escribió este libro blanco para informar a sus miembros sobre las actividades del GLAM (galerías, bibliotecas, archivos y museos) en Wikidata y para destacar las oportunidades de participación de las bibliotecas de investigación, en particular en colecciones de base comunitaria, infraestructura de propiedad comunitaria y colecciones colectivas.

 

 

¿Uso de Wikipedia para buscar información sobre salud? Que se debe tener en cuenta

475px-wikimed2017app

Smith, Timothy M. Using Wikipedia for medical research? What to watch for. American Medical Association. may 28, 2019

Texto completo

Los sitios web de código abierto como Wikipedia son recursos populares para pacientes, médicos y estudiantes de medicina por igual. Pero dado que casi cualquiera puede editar las páginas de esos sitios web, su calidad es muy variable. Dada esta variabilidad, los médicos tienen la obligación ética de ayudar a los pacientes a evitar la información falsa o engañosa sobre la salud al mejorar la calidad de la información presentada. el artículo sugiere cómo el Código de Etica Médica de la AMA puede proporciona orientación relacionada con la investigación y la innovación, como el documento sobre los “Principios para la difusión de los resultados de la investigación” puede ayudar a los médicos a cumplir con sus responsabilidades éticas con respecto a compartir los hallazgos de la investigación para el beneficio final de los pacientes. El documento “Práctica Ética en Telemedicina“, también describe las responsabilidades fundamentales de los médicos con respecto al contenido de salud en línea.

 

Libro Blanco sobre el uso de Wikidata en la comunicación académica por parte de bibliotecas

2019-04-18_10-15-24

Open Knowledge: Association of Research Libraries (ARL) Releases White Paper on the Use of Wikidata in Scholarly Communication, Special Collections. ARL, 2019

Texto completo

En un nuevo Libro Blanco de la Asociación de Bibliotecas de Investigación estadounidenses (ARL), publicado por un grupo de trabajo de expertos usuarios de Wikidata, recomienda una variedad de formas para que los bibliotecarios utilicen la base de conocimiento abierto para avanzar en el descubrimiento global de sus colecciones, profesores e instituciones.

Los bibliotecarios utilizan los datos estructurados de Wikidata sobre personas, temas, conceptos y objetos para acreditar los sistemas de perfiles de profesores de código abierto, para mejorar los registros bibliográficos en catálogos en línea y para colaborar con las comunidades en metadatos significativos, culturalmente relevantes y descriptivos para colecciones y archivos especiales. El documento, distribuido para comentarios públicos en el otoño de 2018, contiene ejemplos de aplicaciones de Wikidata, capturas de pantalla y recomendaciones para la participación a nivel individual u organizativo.