Archivo de la etiqueta: Reutilización de contenidos

Proyecto de investigación sobre el reciclaje de textos

Text Recycling Research Project

https://textrecycling.org/

Una iniciativa financiada por la NSF y en la que participan varias instituciones para investigar el reciclaje de textos en la investigación STEM

El Proyecto de Investigación sobre el Reciclaje de Textos es la primera investigación a gran escala sobre la reutilización por parte de los investigadores de materiales de su propio trabajo anterior en nuevos documentos. El objetivo es comprender mejor el reciclaje de textos, ayudar a crear un consenso entre las partes interesadas y promover una práctica ética y adecuada.

Los investigadores tienen a menudo la ocasión de reutilizar en nuevos documentos material de los que ya han escrito. Ejemplos de ello son la reutilización de pasajes del protocolo del CEI en una propuesta de subvención, la reutilización de material de revisión bibliográfica de una propuesta de subvención en un informe de investigación, la reutilización de la descripción de un aparato experimental de un informe de investigación en un nuevo informe que utiliza el mismo aparato, y la reutilización de material de un artículo publicado en la tesis. Todos estos ejemplos pueden considerarse casos de reciclaje de textos. Sin embargo, es difícil definir el reciclaje de textos de una manera que sea lo suficientemente amplia como para dar cabida a la gama de tales prácticas, pero también lo suficientemente estrecha como para ser útil en la práctica.

El reciclaje de textos es la reutilización de material textual (prosa, imágenes o ecuaciones) en un nuevo documento en el que (1) el material del nuevo documento es idéntico al de la fuente (o sustancialmente equivalente tanto en forma como en contenido), (2) el material no se presenta en el nuevo documento como una cita (mediante comillas o sangría), y (3) al menos un autor del nuevo documento es también autor del documento anterior.

¿Cómo se relacionan las propiedades de los datos, su conservación y su financiación con la reutilización?

Hemphill, L., Pienta, A., Lafia, S., Akmon, D., & Bleckley, D. A. (2022). How do properties of data, their curation, and their funding relate to reuse? Journal of the Association for Information Science and Technology, 1– 13. https://doi.org/10.1002/asi.24646

A pesar de las grandes inversiones públicas para facilitar el uso secundario de los datos, hay poca información sobre los factores específicos que predicen la reutilización de los datos. Utilizando los registros de descarga de datos del Consortium for Political and Social Research (ICPSR), este estudio examina cómo las propiedades de los datos, las decisiones de conservación y los modelos de financiación de los repositorios se relacionan con la reutilización de los datos. Se encontró que los conjuntos de datos depositados por instituciones, sujetos a muchas tareas de curaduría, y cuyo acceso y preservación son financiados externamente, son utilizados con mayor frecuencia. Los resultados confirman que las inversiones en la recopilación, la conservación y la preservación de los datos están asociadas a una mayor reutilización de los mismos.

¿Cuándo está bien el «autoplagio»? Nuevas directrices ofrecen a los investigadores normas para reciclar textos

When is ‘self-plagiarism’ OK? New guidelines offer researchers rules for recycling text

by Cathleen O’GradyJun. Nature, 25, 2021 , 9:00 AM

Ver noticias

Aunque los investigadores suelen tener razones válidas para retomar un texto que ya han publicado y reutilizarlo en nuevos trabajos, los colegas suelen desaprobar ese reciclaje como «autoplagio». Pero cuando Cary Moskovitz, de la Universidad de Duke, que estudia la enseñanza de la escritura, buscó orientación sobre el autoplagio para sus alumnos, se encontró con las manos vacías.

«Prácticamente no había ninguna investigación sobre esta práctica», dice. Los estudiosos no habían examinado realmente la frecuencia con la que los investigadores reciclan sus textos, si esa reutilización constituye una infracción de los derechos de autor o qué tipo de reutilización creen los investigadores que es correcta o incorrecta. Así que Moskovitz se propuso llenar ese vacío. Hoy, su Proyecto de Investigación sobre el Reciclaje de Textos (TRRP, por sus siglas en inglés) ha publicado unas directrices para editores y autores en las que se describe cuándo esta práctica es ética y legal, y cómo presentar el texto reutilizado de forma transparente.

Según Lisa Rasmussen, especialista en ética de la investigación de la Universidad de Carolina del Norte (Charlotte), estas directrices son útiles para replantear estas cuestiones en términos distintos al autoplagio. «Es un problema centrarse demasiado en el autoplagio», afirma. Algunos investigadores que pasan décadas trabajando en un tema concreto, por ejemplo, pueden utilizar métodos muy similares de un estudio a otro, lo que hace que sea eficiente simplemente cortar y pegar las secciones de métodos de sus trabajos. «No deberíamos obligarles a suplantar sus palabras sólo para que no les pille un sistema de software de detección de plagio», como hacen muchos editores de revistas, dice.

El reciclaje de textos es «común, si no omnipresente» en las ciencias, afirma Moskovitz. Con fondos de la Fundación Nacional de la Ciencia de EE.UU., él y un colega analizaron 400 artículos técnicos publicados recientemente, construyendo un algoritmo que calculaba la similitud de las frases en varios artículos derivados de la misma subvención, y cotejando los resultados con codificadores humanos. Encontraron una media de tres frases por artículo que, o bien eran totalmente recicladas, o bien tenían frases significativamente recicladas. Pero era inusual ver un bloque entero de texto idéntico en varios artículos.

Moskovitz descubrió que incluso las escasas orientaciones disponibles sobre la reutilización de textos no daban respuesta a algunas cuestiones éticas importantes, como por ejemplo, la forma de tratar el texto reciclado en dos artículos cuya autoría sólo coincide parcialmente. Y aunque el Comité de Ética de las Publicaciones (COPE) describe algunos casos en los que el reciclaje de textos es aceptable, esa orientación está dirigida a los editores y no a los investigadores, dice Moskovitz.

Las cuestiones jurídicas también son importantes, dice Moskovitz: en una encuesta realizada a editores de las principales revistas de todas las disciplinas, él y sus colaboradores descubrieron que los editores suelen pedir a los investigadores que reformulen el texto por temor a infringir los derechos de autor, ya que los editores, y no los investigadores, suelen ser los propietarios de los derechos de autor en cuestión. Pero los editores no estaban seguros de cuándo era legalmente necesario reescribir el texto. A menudo, sin embargo, esa reformulación puede no ser necesaria desde el punto de vista legal, según las orientaciones del PRT, porque hay buenas razones para pensar que entra en la categoría de «uso justo» de la ley de derechos de autor de Estados Unidos. (Moskovitz dice que no tiene conocimiento de ninguna demanda presentada por los editores sobre el reciclaje de textos).

Para proporcionar una orientación más detallada, Moskovitz y sus colegas se propusieron basarse en el asesoramiento de los editores de revistas y otros especialistas, incluida la COPE. Las recomendaciones resultantes distinguen entre distintos tipos de reciclaje de textos, como la reutilización de textos de trabajos no publicados, como una propuesta de subvención, o la repetición de la descripción de un método en varios artículos publicados. Y sugieren que reciclar el texto adecuadamente puede ayudar a comunicar las ideas con precisión. Según la guía, reformular el texto puede ser menos ético que reciclarlo, ya que oculta el hecho de que el material ha sido reutilizado. Sin embargo, la guía recomienda no utilizar el reciclaje de textos para publicar el mismo trabajo en varios lugares, por ejemplo, haciendo pequeños cambios en un artículo publicado y enviándolo a otro lugar.

Evan Kharasch, anestesiólogo de Duke y redactor jefe de Anesthesiology, que no participó en el proyecto TRRP, encabezó recientemente la primera política editorial de la revista sobre el reciclaje de textos basada en las directrices del TRRP. Cuando los autores describen métodos o protocolos estándar, la revista les permite utilizar un texto idéntico o «sustancialmente equivalente» a publicaciones anteriores, siempre que citen la fuente original. «Parecía apropiado permitir a la gente utilizar su mejor descripción de lo que habían hecho», dice, incluso si se había publicado anteriormente. Aclarar lo que constituye un reciclaje de texto legítimo «ayuda a trazar una línea más brillante contra el plagio», dice Kharasch.

Rasmussen espera que las directrices del PRT ayuden a los editores a centrar su atención en los aspectos de la reutilización de textos que más pueden proteger la integridad de la investigación. Señalar simplemente la repetición de textos mediante un software de detección de plagio no garantiza realmente la integridad, señala, y puede generar trabajo innecesario y potencialmente una pérdida de claridad. Con ello «no se consigue nada que contribuya realmente a la integridad de la investigación», afirma Rasmussen.

Moskovitz espera que la guía del PRT ayude a comprender mejor el alcance del reciclaje de textos y a crear un consenso sobre cuándo puede hacerse de forma ética. «La investigación científica funciona intrínsecamente de forma escalonada», dice. «La gente habla de subirse a hombros de los gigantes, pero en cierto modo, la gente se sube a sus propios hombros».

Reutilización de datos abiertos, una oportunidad para España

 

74dfb6cd664d275bc9bfb9b2d11e071d

 

Reutilización de datos abiertos, una oportunidad para España. Madrid COTEC 2019

 

Texto completo

En este estudio se han identificado los portales de datos abiertos en España y se ha analizado la muestra de juego de datos disponibles y los servicios basados en ellos. Con este análisis se ha hecho un diagnóstico sobre el conocimiento que existe acerca de la reutilización de datos abiertos, el tipo de innovación que se puede promover con ellos y las actividades de promoción de su uso.

A partir de este diagnóstico se han desarrollado algunas reflexiones con el objetivo de construir políticas públicas de gestión de datos para sacar el máximo potencial de ellos a favor de los usuarios.

La fundación COTEC, una organización privada sin ánimo de lucro que fomenta la innovación como motor de desarrollo económico y social en España, ha publicado recientemente su informe “La Reutilización de Datos Abiertos: una oportunidad para España”.  En este estudio, liderado por los expertos Alberto Abella, María Ortiz de Urbina y Carmen de Pablos, se han realizado diferentes ejercicios de diagnóstico para dibujar un escenario que busca mostrar el conocimiento actual sobre la reutilización de los datos abiertos, para, así, identificar directrices y recomendaciones que ayuden a fomentar el uso de los datos en la generación de negocios.

La realización del estudio ha seguido una metodología que incluye principalmente tres áreas de investigación:

  • Estudio de 103 portales nacionales operativos referidos en el mapa de iniciativas de datos.gob.es, y de su madurez según una versión simplificada del modelo establecido por el portal paneuropeo de datos.
  • Estudio de los juegos de datos publicados,  sobre un total de 20.026 datasets identificados, tras el filtrado necesario para evitar duplicidades fruto de las federaciones entre portales.
  • Estudio de la reutilización de los datos publicados a través de una encuesta realizada a los responsables de los portales open data en España.

 

La reutilización de datos abiertos en España

 

dmkc2nrwsaardhw.jpg-large-1080x675

 

«La reutilización de datos abiertos en España II’. Madrid: Universidad Rey Juan Carlos, DesideDatum, 2019

Texto completo

 

España sigue estando en una posición de referencia en datos abiertos en el ámbito público a nivel europeo, pero la reutilización de estos datos está todavía lejos de considerarse óptima por una falta de alineamiento entre las necesidades de la sociedad y los datos publicados. Esta es una de las conclusiones que se incluyen en la actualización del informe ‘La reutilización de datos abiertos en España’, cuya segunda edición se ha presentado hoy en la sede de la Fundación Cotec para la innovación.

 

Alberto Abella, experto de Los 100 de Cotec en Open Data, ha coordinado este trabajo en colaboración con la Universidad Rey Juan Carlos, la Cátedra Transparència i Gestió de Dades y DesideDatum. Para su elaboración se han analizado cerca de 300 portales y más de 30.000 juegos de datos.

El primer informe fue uno de los proyectos seleccionados por Cotec dentro de su Programa de Innovación Abierta en 2016. Desde 2017, el sector de datos abiertos ha crecido ampliamente, tanto en portales (+171%), como en conjunto de datos (+62%). El crecimiento también se aprecia en los servicios generados por la administración pública (+55%), aunque en el sector privado este porcentaje se mantiene respecto a 2017 en un 24%.

La geolocalización sigue siendo la base de la mayoría de los servicios generados (74%), mientras que han bajado aquellos basados en la actualización de datos del 33% en 2017 al 26% en 2019. Este descenso también se aprecia notablemente en los servicios basados en la sostenibilidad, entendida como la viabilidad económica de un servicio a medio plazo, que caen 21 puntos porcentuales respecto a 2017 (del 33% en 2017 al 26 % en 2019).

En relación con las temáticas, la mayoría de los servicios que se están creando se concentran en el área de la salud, seguido por el transporte y la meteorología.

El estudio se completa con un conjunto de recomendaciones para facilitar la creación de negocios innovadores a partir de los datos abiertos. Como se destacaba en el primer informe, se sigue hablando de la necesidad de crear una asociación de publicadores de datos, para coordinar esfuerzos que ayuden a homogeneizar la información, adoptar interpretaciones comunes de las normativas existentes y generar conocimiento sobre el uso de datos y su impacto económico y social.

 

¿Qué es la reutilización de datos de investigación?

 

img_content_aineistonhallinta

Van de Sandt, Stephanie; Dallmeier-Tiessen, S.; Lavasa, Artemis; Petras, Vivien “The Definition of Reuse”. Data Science Journal 18(1), 2019 DOI: 10.5334/dsj-2019-022

Texto completo

La capacidad de reutilizar los datos de la investigación se considera un beneficio clave para la comunidad investigadora en general. Los investigadores de todas las disciplinas se enfrentan a la presión de compartir sus datos de investigación para que puedan ser reutilizados. La demanda de uso y reutilización de datos tiene implicaciones sobre la forma en que documentamos, publicamos y compartimos la investigación en primer lugar y, quizás lo más importante, afecta a la forma en que medimos el impacto de la investigación, que suele ser una medida de su uso y reutilización.

Es sorprendente que las comunidades de investigación, los responsables políticos, etc. no hayan definido claramente qué es el uso y la reutilización. Se necesita una definición clara de uso y reutilización para establecer mejores métricas para un registro académico integral de individuos, instituciones, organizaciones, etc. Por lo tanto, este artículo presenta una primera definición de reutilización de datos de investigación. Las características de la reutilización se identifican examinando la etimología del término y el análisis del discurso actual, lo que conduce a una serie de escenarios de reutilización que muestran la complejidad del panorama actual de la investigación, que ha ido evolucionando hacia un enfoque basado en datos. El análisis subraya que no hay razón para distinguir entre uso y reutilización. Discutimos lo que esto significa para posibles nuevas métricas que intentan cubrir las prácticas de la Ciencia Abierta de manera más completa. Esperamos que la definición resultante permita una estrategia mejor y más refinada para la Ciencia Abierta.

 

 

Reproducibilidad y Replicabilidad en la Ciencia

 

sites_192635

 

Reproducibility and Replicability in Science.  Washington : The National Academies of Sciences, Engineering, and Medicine, 2019

Texto completo

 

Una de las vías por las que la comunidad científica confirma la validez de un nuevo descubrimiento científico es repitiendo la investigación que lo produjo. Cuando un esfuerzo científico no logra confirmar independientemente los cálculos o resultados de un estudio anterior, algunos temen que pueda ser un síntoma de falta de rigor en la ciencia, mientras que otros sostienen que tal inconsistencia observada puede ser un elemento precursor importante para un nuevo descubrimiento.

Las preocupaciones sobre la reproducibilidad y la replicabilidad se han expresado tanto en los medios científicos como en los populares. A medida que estas preocupaciones salieron a la luz, el Congreso solicitó que The National Academies of Sciences, Engineering, and Medicine llevaran a cabo un estudio para evaluar el alcance de los temas relacionados con la reproducibilidad y la replicabilidad y para ofrecer recomendaciones para mejorar el rigor y la transparencia en la investigación científica.

El informe ofrece definiciones de reproducibilidad y replicabilidad y examina los factores que pueden conducir a la no reproducibilidad y la no reproducibilidad en la investigación. Si bien la reproducibilidad es sencilla y debe esperarse en general, la replicabilidad es más matizada y, en algunos casos, la falta de replicabilidad puede ayudar al proceso de descubrimiento científico. El informe ofrece recomendaciones a investigadores, instituciones académicas, revistas y financiadores sobre las medidas que pueden tomar para mejorar la reproducibilidad y replicabilidad en la ciencia.

 

 

 

 

 

Libro Blanco sobre reutilización de contenidos digitales

16184-istock-000008756145xsmall-s

A White Paper From the Developing a Framework for Measuring Reuse of Digital Objects project. IMLS, 2018

https://osf.io/y9ghc/

“Developing a Framework for Measuring Reuse of Digital Objects.” de IMLS. El objetivo del proyecto es llevar a cabo una evaluación formal de las necesidades de la comunidad de la Biblioteca Digital para determinar la funcionalidad deseada para una futura caja de herramientas de evaluación de la reutilización de objetos digitales. Este conjunto de herramientas recopilará los recursos disponibles, las mejores prácticas y los casos de uso para estudiar la reutilización de los activos digitales propiedad de organizaciones de patrimonio cultural y de investigación.

Este libro blanco (a) proporciona una visión general del proyecto Measuring Reuse, incluyendo informacion de Assessment Interest Group (AIG) (b) describe los métodos utilizados por el equipo del proyecto, (c) resume los resultados, y (d) discute los pasos siguientes a seguir.

 

Cita y reutilización de datos de investigación : análisis del contenido de las publicaciones a texto completo.

 

dmkc2nrwsaardhw-large-1024x750

Zhao, M., E. Yan, et al. «Data set mentions and citations: A content analysis of full-text publications.» Journal of the Association for Information Science and Technology vol. 69, n. 1 (2018). pp. 32-46. http://dx.doi.org/10.1002/asi.23919

 

Este estudio proporciona evidencias de menciones y citas de conjuntos de datos en múltiples disciplinas basadas en un análisis del contenido de 600 publicaciones en PLoS One. Se encuentra que las menciones y citas de los conjuntos de datos variaron enormemente entre disciplinas en términos de cómo se recolectaron, referenciaron y curaron los conjuntos de datos. Aunque la mayoría de los artículos proporcionaron libre acceso a los datos, en un número limitado de artículos se utilizaron formas normalizadas de atribución de datos, como los DOI y las citas de datos. Además, la reutilización de los datos tuvo lugar en menos del 30% de las publicaciones que utilizaron los datos, lo que sugiere que los investigadores todavía se inclinan a crear y utilizar sus propios conjuntos de datos, en lugar de reutilizar los datos previamente curados. Este documento proporciona una comprensión exhaustiva de cómo se utilizan los conjuntos de datos en la ciencia y ayuda a las instituciones y editores a elaborar políticas de datos útiles.

Reutilización de datos de investigación: análisis de confianza y fiabilidad de los datos

trust-data

Yoon, A. «Data reusers’ trust development.» Journal of the Association for Information Science and Technology vol., n. (2016). pp.: http://doi.wiley.com/10.1002/asi.23730

La reutilización de datos se refiere al uso secundario de datos, no para su propósito original sino para estudiar nuevos problemas. Aunque la reutilización de datos aun no es de uso común en todas disciplina, los beneficios de la reutilización de datos compartidos han sido ratificados por diferentes organizaciones y grupos de investigadores, siendo una preocupación importante en muchas disciplinas. El reto que se plantea en torno a la cuestión es la fiabilidad de los datos y los perrjuicios derivados del uso de datos de baja caldiad

La valoración de los datos es uno de los grandes retos de cara a su reutiilizacón, esta cuestión se ha puesto de relieve sobre todo en los últimos años, que han aumentado las iniciativas de puesta en marcha de repositorios de datos de investigación; en los que se plantea la cuestión relativa a la confiabilidad de los datos, sobre todo debido a la falta de estándares para asegurar la calidad de los datos y los posibles daños derivados del uso de datos de baja calidad.

Esta investigación explora muchas facetas en torno a la fiabilidad que tienen los reutilizadores de datos cuando usan datos generados por otros investigadores, centrándose en el proceso de juicio de confianza y que factores críticos son los que determinan la confianza en los datos. El autor adoptó un enfoque cualitativo interpretativo mediante el uso de entrevistas semiestructuradas en profundidad como método de investigación principal.

Los resultados del estudio sugieren diferentes etapas de desarrollo en la generación de la confianza asociada a el proceso de reutilización de datos. La confianza de los reutilizadores en un sitios de alojamiento de daros de investigación se genera fundamentalmente a partir de las propias experiencias de los investigadores que utilizan estos datos, pero hay que tener en cuenta que esta fiabilidad es fluctuante, ya que puede ser formada, perdida, rechazada y recuperada durante sus experiencias de reutilización de datos. Estas etapas reflejan la naturaleza dinámica de la confianza.