Archivo de la etiqueta: Citas bibliográficas

Perfiles de citas de Google Scholar: lo bueno, lo malo y lo mejor

gsharzing

Google Scholar Citation Profiles: the good, the bad, and the better

Ver original

Desde 2012 Google Scholar ofrece a los académicos la oportunidad de crear su propio perfil, algo que realmente te recomendaría que hicieras. Configurar un perfil de citación de Google Scholar es fácil y muy rápido. Un Perfil GS es su tarjeta de presentación académica, es la forma más rápida y fácil para que otros académicos puedan ver todas sus publicaciones de un vistazo. Si tienes un nombre común, también es la única manera segura de desambiguar tu registro de publicación del de sus homónimos.

Lo bueno: una gran solución para las citas «perdidas»

La creación de un perfil GS es también una gran solución para uno de los mayores problemas en el análisis de citas: la presencia de citas «perdidas». Las citas extraviadas no son lo mismo que múltiples versiones web idénticas de un mismo documento; Google Scholar normalmente agrega las que se encuentran en un registro maestro. Lo que quiero decir con «citas perdidas» son registros que no han sido agregados bajo su registro maestro. Estas segundas (y a veces terceras y posteriores) versiones del registro típicamente sólo tienen un pequeño número de citas cada una y son generalmente el resultado de la mala ortografía del nombre de un autor, el título de la publicación o de la revista. También pueden ser causados por errores de análisis de Google Scholar. Para más detalles sobre esto, por favor vea: Google Scholar: Stray citations.

Las citas «extraviadas» tienden a ser particularmente comunes para las publicaciones «no tradicionales», tales como software, libros, capítulos de libros y documentos de conferencias, ya que generalmente no existe una forma estandarizada de hacer referencia a ellas. Por lo tanto, es mucho más difícil para Google Scholar averiguar si se refieren a la misma publicación. Por ejemplo, aunque Google Scholar hace un trabajo mucho mejor que la Web of Science en cuanto a referencias a mi programa de software Publish o Perish, todavía hay muchas citas perdidas, que – en mi perfil de GS – todas las he fusionado en el registro maestro. Cualquier registro en su perfil de GS que contenga citas fusionadas se muestra con un * detrás de las citas. Puedes fusionar registros iniciando sesión en su perfil, marcando la casilla situada frente a los registros que deseas fusionar y haciendo clic en fusionar.

No, esto no significa que Google Scholar sea malo.

Es importante señalar que los registros de citas perdidas no son exclusivos de Google Scholar. Por ejemplo, también prevalecen en Web of Science si se utiliza la función de búsqueda «Cited Reference»[que incluye referencias a libros y revistas no listadas en ISI] en lugar de la función de búsqueda general. Necesitamos enviar un informe de cambio de datos a Clarivate casi todas las semanas para pedirles que fusionen mis citas perdidas en sus registros maestros relevantes. Ver también: Web of Science: How to be robbed of 10 years of citations in one week! and Bank error in your favour? How to gain 3,000 citations in a week.

Uno de los académicos más citados en el campo de la gestión – Geert Hofstede – ha publicado un libro titulado  «Cultures Consequence«. Este libro se publicó por primera vez en 1980, con una segunda edición revisada en 2001. Estas dos versiones tienen, respectivamente, más de 12.000 y más de 9.000 citas bajo el título «Cultures Consequence«. Sin embargo, también hay cientos de registros adicionales de citas perdidas en la búsqueda de «Cited Reference» de ISI, todos ellos referidos a los mismos dos libros. Muchas de las entradas extraviadas en ISI son simples errores ortográficos del título. En la mayoría de estos casos, las referencias eran correctas en los trabajos de referencia y los errores de ortografía parecen haber sido cometidos por el personal de que introduce datos de ISI.

Lo malo: perfiles muy contaminados (pero se puede evitar fácilmente)

Como eres tú (no Google Scholar) quien está creando este perfil, eres tú quien necesita mantenerlo y mantenerlo actualizado. Esto no es responsabilidad de Google Scholar. Sin embargo, muchos investigadores sólo tardan unos minutos en crear su perfil, no miran ninguna de las opciones y por lo tanto no se dan cuenta de que la opción por defecto es añadir nuevos artículos automáticamente. Esto no es del todo sorprendente, ya que Google Scholar no hace que sea muy obvio cómo hacerlo. Pero en realidad es muy fácil. Simplemente ingresasa a tu perfil y haz clic en la pequeña cruz blanca sobre un cuadradito negro que se ve en la barra de título.

Haz clic en «Configurar actualizaciones del artículo». Luego, en la página siguiente, haz clic en la segunda opción. No «actives»  la opción «Recomendada» de Google Scholar. Como es común en este tipo de servicios, las opciones recomendadas son para personas perezosas y olvidadizas. Podrías pensar que te ahorrará tiempo, ya que no tienes que confirmar las actualizaciones cada vez, sino ser realista: ¿cuántos artículos publicas al año? La mayoría de nosotros no publicamos tanto como para que tener que iniciar sesión, después de un mensaje de correo electrónico con un enlace, para aprobar adiciones legítimas se convierta en una carga. Se tarda 30 segundos. También es una gran oportunidad para corregir o complementar manualmente cualquier cosa que GS haya hecho mal editando el registro en cuestión.

Esencial para aquellos con nombres comunes

Si tienes un nombre común, poner tus actualizaciones en manual no es opcional, ¡es esencial!

Pero incluso si tu nombre es único  es posible que desees mantener el control de calidad en tus propias manos. Si por ejemplo encuentro  tres publicaciones que GS cree que deberían estar en mi perfil. Los dos primeros no lo son. La tercera parece estar confundiendo dos artículos dek mismo número de Scientometrics. ¿Ninguna de ellas diria mucho de tu credibilidad como investigador académico?

Esto no significa que Google Scholar sea una basura. (2)

Sin embargo, ten en cuenta que esto no significa que los datos de Google Scholar sean malos y que deben evitarse a toda costa (véase también Sacrifice a little accuracy for a lot more comprehensive coverage). Ninguna de las tres «publicaciones» tiene citas y en el curso normal de los acontecimientos todo el mundo las ignoraría de todos modos. ¿Pero por qué contaminar tu perfil con ellos?

Una vez más, no pienses que los perfiles muy contaminados son exclusivos de Google Scholar. Los errores de desambiguación de autor también existen en Web of Knowledge Essential Science Indicators. Basta con mirar a los 10 autores más citados según la Web of Knowledge: todos se llaman Zhang, Wang, Li o Liu y de promedio publican 12 artículos al día, 365 días al año. ¿Has oído hablar de la expresión china? «¿»Tres Zhang (o/y) Cuatro Li»? Significa «cualquiera» o «todos».

Lo mejor: Perfiles de GS y Publicar o Perecer

Desde la versión 5, mi software gratuito de análisis de citas Publish or Perish permite realizar búsquedas en Google Scholar Profile. Por lo tanto, cualquier trabajo que pongas en tu perfil de Google Scholar merece la pena, ya que podrás mostrar tu perfil completo en una lista ordenada en Publicar o Perecer y ordenarlo de la forma que desees. Esto es más difícil en la interfaz web, que sólo permite ordenar por título y año y por defecto sólo te proporciona 10 resultados por página. También obtendrás una gran cantidad de métricas de citación basadas en un perfil preciso y completo.

Desde la versión 6, el uso de Publish or Perish también te permite buscar palabras clave e instituciones, lo que hace que sea muy fácil obtener una visión general de los investigadores más citados en un campo o institución en particular. Esto puede ser particularmente útil cuando se buscan colaboradores, revisores, conferencistas, etc. Sin embargo, ten en cuenta que los campos de Google Scholar se seleccionan a sí mismos y no están estandarizados. Por ejemplo, para una de mis propias áreas de especialización, he visto utilizar cuatro variantes de etiquetas diferentes: «HRM Internacional», «IHRM», «International Human Resource Management» y «International HR»

Post relacionados

Anne-Wil Harzing es profesora de Gestión Internacional en la Universidad de Middlesex, Londres, y profesora invitada de Gestión Internacional en la Universidad de Tilburg. Además de sus deberes académicos, también mantiene la lista de calidad de revistas y es la fuerza impulsora detrás del popular programa de software Publish or Perish.

Guía para citar en textos académicos

51mmr1h2bfil-_sy346_

 

Ingrid López Inzunza (Autor), Alicia Caldera Quiroz (Autor), Cecilia Sánchez Salinas (Redactor).. Guía para citar en textos académicos
Versión Kindle, 2018

Gratis en Amazon

Este eBook sirve de apoyo para orientar, tanto a estudiantes como a profesores, sobre las formas de citación y referenciación más comunes, del sistema APA. Mediante imágenes y ejemplos sencillos, todos podrán aprender a citar correctamente, para escribir textos académicos libres de plagio.

 

 

Prácticas de citación y cómo estandarizar las referencias a colecciones de archivo únicas y distintas

2018-11-02_14-15-58

Citation Capture: Challenges and Opportunities with Citing Archives Consistently”. London: RLUK, National Archives (UK), and JISC Publish, 2018

Texto completo

 

Research Libraries UK (RLUK), The National Archives (TNA) y JISC han publicado un informe para iniciar un debate sobre las prácticas de citación y cómo estandarizar las referencias a colecciones únicas y distintas -unique and distinct collections (UDC)- que se encuentran en repositorios de todo el Reino Unido.

 

Cada año, decenas de miles de citas se incluyen en las notas al pie y al final de las publicaciones de investigación, a pesar de que actualmente no existe un sistema coherente y ampliamente aceptado de referencia de los depósitos de colecciones únicas y distintas (UDC). Una encuesta de la ENT realizada en 2015 reveló que sólo un pequeño porcentaje de los archivos orientaba proactivamente a los usuarios sobre la citación.

La creación de un marco más coherente sobre la forma en que los investigadores citan las colecciones únicas reportará dos beneficios principales.

  • Al estandarizar las referencias a las colecciones y los materiales que contienen, será más fácil para los archiveros, bibliotecarios y gestores de colecciones evaluar su uso y tomar decisiones informadas sobre la gestión de las colecciones.
  • En segundo lugar, proporcionará parámetros valiosos para que los repositorios puedan demostrar el impacto y justificar la financiación.

Los criterios clave para el desarrollo de un modelo de citación estandarizado para los repositorios de documentos únicos incluyen la integración con las convenciones existentes; la accesibilidad para académicos y no académicos; tener un único punto de acceso para la orientación; y la relativa brevedad de las referencias.

Los posibles modelos de citación incluyen la referencia al nombre completo del repositorio para la citación inicial, seguido de un código de letra abreviado basado en el nombre del repositorio para citas posteriores; o un modelo basado en los códigos ARCHON existentes.

La evidencia de la investigación primaria apunta hacia códigos de tres letras como el modelo de citación más apropiado. La principal ventaja es que puede integrarse con la práctica actual. Aunque este modelo llevaría a la duplicación de ciertos códigos, esto no se considera una barrera para la captura de citas en publicaciones académicas, siempre y cuando el nombre completo del repositorio se cite en la cita inicial.

Las conclusiones del taller de validación indican que un modelo basado en los códigos ARCHON existentes puede ofrecer una mayor integración con las infraestructuras digitales emergentes, como los códigos ORCID, así como garantizar que cada depósito tenga un identificador único sin duplicación. Los retos asociados con este modelo incluyen que no todos los repositorios tienen actualmente códigos ARCHON, y que el modelo favorecería que los usuarios conozcan y reproduzcan con precisión los códigos de los repositorios.

Otros retos asociados con ambos modelos incluyen la capacidad de adaptarse a los cambios de nombre de los repositorios; la captura de citas en línea y en los medios sociales; y el tiempo y la inversión financiera que probablemente se requerirá para asegurar que los usuarios adopten las directrices.

Las estrategias para integrar las mejores prácticas y garantizar la aceptación de un modelo normalizado incluyen la publicación generalizada de directrices; el apoyo de los editores; el fomento de la adopción de complementos de catálogo para aumentar la precisión y la coherencia de las citas; y la realización de una campaña publicitaria para sensibilizar y aumentar los conocimientos y las aptitudes necesarios para captar citas.

La inversión en herramientas de recogida de citas a medida para automatizar el proceso de captura probablemente sea beneficiosa para garantizar la precisión y exhaustividad de las recopilaciones de datos; otra ventaja sería la capacidad de responder a los cambios en la forma en que se utilizan las colecciones de documentos únicos, tanto ahora como en el futuro.

 

 

¿El acceso abierto aumenta el número de citas de las revistas? una investigación empírica en múltiples disciplinas.

43797254580_7f25da8d21_b_d

Li Y, Wu C, Yan E, Li K (2018) Will open access increase journal CiteScores? An empirical investigation over multiple disciplines. PLoS ONE 13(8): e0201885. https://doi.org/10.1371/journal.pone.0201885

Texto completo

 

Este estudio pretende evaluar el impacto de las revistas de acceso abierto desde la perspectiva de la ventaja de la citación. Los estudios anteriores sobre este tema han comparado típicamente la diferencia de impacto entre las revistas de suscripción y de acceso abierto a nivel de artículos o revistas. Aunque la mayoría de los estudios parecen apoyar la ventaja de las citas de las revistas o artículos de acceso abierto, muchos tienen una cobertura limitada de los dominios del conocimiento y, por lo tanto, son insuficientes para extraer conclusiones con respecto a las diferencias de impacto interdisciplinarias. En este estudio, se ha incluido una lista completa de revistas de acceso abierto que representan una amplia gama de dominios de conocimiento. En este estudio se utilizaron dos fuentes de datos abiertas: Journal Metrics de Scopus (https://journalmetrics.scopus.com/) y el Directory of Open Access Journals (DOAJ).

CiteScore es una métrica que mide la relación de citas por artículo publicado. Proporciona un valor adicional para comparar y evaluar revistas científicas. CiteScore calcula las citas de todos los documentos de un año en concreto en todos los documentos publicados en los tres años anteriores. Ese número se divide por el número de documentos indexados en Scopus publicados en esos mismos años.

En particular, se investigaron dos tipos de efectos heterogéneos del tratamiento: (1) el efecto del tratamiento diferencial entre revistas agrupadas por campo académico, editor y nivel; y (2) los efectos del tratamiento diferencial del Acceso Abierto.

La magnitud del aumento de las citas de una revista dependerá de las características de la revista, como el campo, el rango y la disciplina de la misma, así como de las tendencias de revistas similares hacia el acceso abierto. Se encontró un efecto positivo para las revistas de OA en general. Sin embargo, el efecto es más pronunciado en las revistas publicadas por los cinco grandes editores y en las revistas de Biología, Medicina y Ciencia. De manera sorprendente, el efecto del acceso abierto es más pronunciado en las revistas de rango inferior que en las de rango superior, lo que sugiere un efecto de «larga cola». (Long Tail)

45614745151_8afee7039a_b_d

 

Estos hallazgos arrojan nueva luz sobre el efecto del acceso abierto en las revistas y pueden ayudar a las partes interesadas de la edición de revistas a  adoptar decisiones sobre la política de acceso abierto.

 

 

 

¿Se ajustan las ventanas fijas de citación a las velocidades de maduración del impacto de las revistas científicas?

a-ripple

Dorta González, M. I. and P. Dorta González «¿Se ajustan las ventanas fijas de citación a las velocidades de maduración del impacto de las revistas científicas?» Investigación bibliotecológica vol. 30, n. 68 (2016). pp. 73-89.

Texto completo

 

Los distintos campos científicos presentan prácticas de citación diferentes. Por ello, los indicadores bibliométricos basados en citas necesitan ser normalizados para permitir comparaciones entre campos. En este trabajo se analizan más de 600 revistas de ocho categorías JCR. Los resultados obtenidos indican que la velocidad de maduración del impacto varía considerablemente de una categoría a otra. El tiempo transcurrido hasta que la distribución de citas alcanza su máximo oscila entre 2 y 5 años, de ahí que el comienzo y finalización de la ventana de citación tengan un efecto determinante sobre el factor de impacto. Algunas revistas son penalizadas por el factor de impacto a 2 años y favorecidas por el de 5 años, y viceversa. Sin embargo, existen factores de impacto con ventanas variables de citación que producen, en términos generales, medidas de tendencia central más próximas.

 

Las revistas de acceso abierto tienen una clara ventaja de citación sobre las revistas de suscripción

average-citations-header-image

Curno, Mirjam ;  Oeben, Stephanie «Scientific Excellence at Scale: Open Access journals have a clear citation advantage over subscription journals» Frontiers, 2018

Texto completo

Frontiers es el cuarto editor más citado entre los 20 mayores editores, clasificados por el promedio de citas en un período de tres años (2015-2017). El mismo análisis también revela una ventaja de las revistas de acceso abierto sobre las revistas de suscripción en los últimos tres años.

 

En 2017, el 16% de los artículos revisados por pares de todo el mundo se publicaron en revistas de acceso totalmente abierto, según SCImago (2018). Después de más de dos décadas de la revolución del Acceso Abierto, esto está muy lejos del aspirado 100% . Una de las muchas razones por las que la transición al acceso abierto resultó ser tan difícil es el debate sobre si el acceso abierto puede producir excelencia científica.

En este post de blog se realiza un análisis de revistas contrastando revistas de acceso abierto y revistas de suscripción basadas en datos de SCImago (2018, los datos de SCImago se basan en la base de datos Scopus de Elsevier). El conjunto de datos completo está disponible en Figshare. Estos datos fueron presentados en el EuroScience Open Forum 2018, aquí dispones del powerpoint y la videoconferencia.

En 2017, cuatro de los 20 mayores editores son editores de acceso abierto (Figura 1), 16 son editores de suscripción tradicionales con una gama de revistas de suscripción, híbridas y de acceso abierto.

total-documents-2017-new23

 Figura 1. Los 20 primeros editores por volumen en 2017 en SCImago (2018), En rojo son editores de Acceso Abierto completo.

 

Si se observa la media de citas en un período de tres años (2015-2017) entre los 20 mayores editores, el rendimiento de los editores de acceso totalmente abierto es notable (Figura 2).

top-20

Figura 2. Promedio de citas por artículo, de los artículos publicados en 2015, 2016 y 2017 para los 20 principales editores en 2017 (SCImago, 2018). En rojo están todos los editores de acceso abierto

 

Frontiers ocupa el cuarto lugar entre los 20 editores más importantes por el promedio de citas por artículo publicado entre 2015 y 2017. La tasa de citación media de Frontiers es de 3,65 por artículo y muy por encima de la media de 2,7 para las revistas de suscripción y 2,9 para las de acceso abierto. Entre los editores clasificados, sólo las sociedades científicas especializadas en un campo único y muy citado, como la química o la física, ocupan un lugar más destacado. Entre los editores multidisciplinarios, Frontiers tiene la tasa de citación media más alta.

Otros editores de acceso totalmente abierto también se sitúan por encima de la media en las tasas de citación: PLOS ocupa el sexto lugar con una tasa de citación promedio de 3.25 y MDPI el octavo con una tasa de citación promedio de 3.10 (Figura 2).

En general, a lo largo de los últimos tres años, las revistas de acceso abierto reciben en promedio un 7% más de citas que las revistas de suscripción (Figura 3). Curiosamente, las revistas de acceso abierto publicadas por editores de suscripción tradicionales están logrando en general un mayor impacto dentro del mismo editor.

top-20-publishers-hindawi-amended1

Figura 3. Promedio de citas por artículo en un período de tres años (2015-17) para los 20 principales editores en 2017 en SCImago (2018),

Si desglosamos las revistas de acceso abierto y de suscripción de esos 20 editores, las revistas de acceso abierto tienen una ventaja en las citas, con una media de 2,9 citas por artículo para las revistas de acceso abierto frente a 2,7 citas por artículo para las revistas de suscripción (incluidos los híbridos, Figura 3).

Mientras que 10 de las 16 editoriales tradicionales muestran una clara ventaja de citas para sus revistas de acceso abierto, hay algunas variaciones, que probablemente reflejen estrategias diferentes con los títulos, así como la posición de los editores en términos del contenido que atraen.

Estos resultados están en línea con un reciente Libro Blanco publicado por Springer Nature y Digital Science, que demostró una clara ventaja de los artículos de acceso abierto sobre los artículos de pago en revistas de suscripción híbridas. Los artículos publicados en el formato de acceso abierto fueron 1,6 veces más citados que los artículos de pago en las mismas revistas.

Los hallazgos también están en línea con la ventaja de las citas de las revistas en Frontiers Open Access journals in the 2017 Journal Citation Reports and 2017 CiteSc

Muchos han apreciado los beneficios de la Ciencia Abierta para la sociedad; el descubrimiento, la innovación, el crecimiento económico y el acceso público al conocimiento científico. Estos datos ahora muestran claramente que las revistas de acceso abierto superan a las revistas de suscripción tradicionales en las métricas de citas y ofrecen un mejor impacto para los autores.

 

 

 

Como influyen los factores de posicionamiento en la ordenación por relevancia en Google Scholar

epi-aseo-cabecera

Rovira, Cristòfol and Guerrero-Solé, Frederic and Codina, Lluís «Received citations as a main SEO factor of Google Scholar results ranking«. El profesional de la información, 2018, vol. 27, n. 3, pp. 559-569.

Texto completo

 

El objetivo de este artículo es analizar los factores de posicionamiento (SEO) externos que pueden influir en la ordenación por relevancia en Google Scholar y luego identificar el peso las citas recibidas en esta ordenación. Se ha aplicado una metodología de ingeniería inversa comparando el ranking de Google Scholar con un ranking formado tan sólo por el número de citas recibidas por los documentos. El estudio se realizó a partir de cuatro tipos de búsquedas sin palabras clave: por publicación, año, autor y “citado por”. Los resultados fueron coincidentes en las cuatro muestras con coeficientes de correlación entre los dos rankings superiores al 0,9. El presente estudio demuestra de forma más clara que en anteriores investigaciones que las citas recibidas es el factor SEO externo más relevante en el ranking de los resultados en Google Scholar. Los demás factores tienen una influencia mínima. Esta información proporciona una base sólida para la disciplina del posicionamiento en buscadores académicos (ASEO). También hemos desarrollado una nueva propuesta metodológica que aísla los factores SEO externos y que puede ser útil en futuras investigaciones.

ZoteroBib: crear una bibliografía con Zotero sin necesidad de instalar ningún software

 

zoterobib-680x424

ZoteroBib

https://zbib.org/

 

ZoteroBib ayuda a construir una bibliografía instantáneamente desde cualquier ordenador o dispositivo, sin crear una cuenta ni instalar ningún software. El equipo que está detrás de Zotero, la poderosa herramienta de investigación de código abierto recomendada por miles de universidades de todo el mundo, te la ofrece para que puedas confiar en que te ayudará a añadir fuentes y producir bibliografías perfectas sin problemas.

zbib

 

Añadir una entrada de bibliografía

Simplemente encuentra lo que estás buscando en otra pestaña del navegador y copia la URL de la página en la barra de búsqueda de ZoteroBib. ZoteroBib puede extraer automáticamente datos de artículos de periódicos y revistas, catálogos de bibliotecas, artículos de revistas, sitios como Amazon y Google Books, y mucho más. También puedes pegar o escribir un ID de ISBN, DOI, PMID o arXiv, o puedes buscar por título.

Entrada manual

Si la importación automática no encuentra lo que estás buscando o estás introduciendo algo sin una URL o identificador, puedes introducir la información de referencia a mano.

Cambiar el título

Para cambiar el nombre de tu bibliografía, haz clic en su título. Un título puede ser útil si estás compartiendo una bibliografía con otros.

Editar un item

Es posible que necesites agregar o cambiar algunos campos después de agregar un elemento. Haz clic en una entrada de bibliografía para hacer cambios manuales.

Borrar item

Haz clic en el icono «Delete» situado junto a una entrada de bibliografía para eliminarla. Para iniciar una nueva bibliografía, haz clic en «Delete All» para eliminar todas las entradas.

Selección de estilo

Formatea tu bibliografía usando APA, MLA, Chicago / Turabian, o cualquiera de los más de 9,000 estilos de CSL.

Copiar Cita / Nota

Mientras escribes, puedes generar rápidamente citas paréntesis o notas al pie o al final del documento para pegarlas en el documento sin tener que escribir nombres o fechas a mano.

Exportación

Cuando haya terminado, puedes copiar una bibliografía formateada en el portapapeles y pegarla en el documento. También puedes exportarlo en HTML para añadirlo a una página web, un documento RTF para abrirlo en un procesador de texto o un archivo RIS o BibTeX para importarlo a un gestor de referencias.

Autoguardado

ZoteroBib guarda automáticamente tu bibliografía en la memoria local de tu navegador – puedes cerrar la página y volver a ella en cualquier momento. (Si estás usando el modo privado / de incógnito en tu navegador, tu bibliografía se borrará cuando cierres la ventana.

Enlace a esta versión

Si desea editar tu bibliografía en otro dispositivo, compartirla con otra persona o cambiar a otra bibliografía, puede generar un enlace a una copia de la versión actual en zbib.org. Utiliza el enlace para recuperar su bibliografía más adelante.

The Venice Scholar Index: un sistema de extracción automática de referencias bibliográficas encontradas en un gran número de libros y revistas digitalizados

venice-scholar-index

 

El el proyecto Linked Books Project ha desarrollado un sistema de extracción automática de referencias bibliográficas encontradas en un gran número de libros y revistas digitalizados, Configurando así el índice de citas Venice Scholar Index de la literatura sobre la historia de Venecia, que indiza cerca de 3.000 volúmenes de estudios desde mediados del siglo XIX hasta 2013, de los que se han extraído unos 4 millones de referencias bibliográficas. Pero que puede ser utilizado en cualquier otro área de conocimiento.

 

Venice Scholar Index es el primer prototipo resultante del Linked Books Project, un proyecto liderado por Giovanni Colavizza y Matteo Romanello del Laboratorio de Humanidades Digitales de la EPFL (École Polytechnique Fédérale de Lausanne), con socios en Venecia, Milán y Roma.

El proyecto explora la historia de Venecia a través de referencias a la literatura científica, así como a documentos de archivo encontrados en publicaciones. Para lograr este objetivo, el proyecto ha desarrollado un sistema de extracción automática de referencias bibliográficas encontradas en un gran número de libros y revistas digitalizados, que se ha aplicado posteriormente a las publicaciones sobre la historia de Venecia, su principal caso de uso, pero que pueden ser utilizadas para cualquier otro área de las Humanidades.

The Linked Books Project está específicamente interesado en analizar la interacción entre las citas de documentos primarios (por ejemplo, de archivo) y las de fuentes secundarias (literatura académica), y los perfiles de citas de publicaciones a través del tiempo. Con este fin, desarrolló el Venice Scholar Index, una rica interfaz de búsqueda para navegar a través de la red de citas resultante, con el objetivo final de interconectar los archivos digitales y las bibliotecas digitales.

Los datos de citas en los que se basa Venice Scholar Index, se han modelado utilizando el Modelo de Datos de OpenCitations y utilizarán OpenCitations Corpus como plataforma de publicación.

 

Proyecto EXCITE. Extracción de citas de documentos PDF de las Ciencias sociales

 

2016_06_14_excite_final_0

The EXCITE Project (Extraction of Citations from PDF Documents)

http://west.uni-koblenz.de/en/research/excite/

EXCITE software https://github.com/exciteproject

Dado que las ciencias sociales sólo tienen una cobertura marginal en las principales bases de datos bibliográficas, el objetivo de este proyecto es poner a disposición de los investigadores más datos de citas, con especial atención a las ciencias sociales. Para llevar a cabo el proyecto se ha desarrollado un conjunto de algoritmos que permiten la extracción de información de referencia de documentos PDF, lo que permite cotejar las cadenas de entradas de referencia con las bases de datos bibliográficas existentes.

 

El Proyecto EXCITE tiene como finalidad la extracción de citas directamente de las publicaciones de Ciencias Sociales, es impulsado conjuntamente por la Universidad de Coblenza-Landau y el GESIS (Instituto de Ciencias Sociales de Leibniz), y financiado por la Deutsche Forschungsgemeinschaft (DFG)  Está dirigido por Steffen Staab, director del Instituto de Ciencia y Tecnología Web de la Universidad de Coblenza-Landau, y Philipp Mayr del GESIS.

La escasez de datos de citas en las ciencias sociales internacionales, es bien conocida por los investigadores en este campo y a menudo ha sido objeto de estudios académicos. Los datos de citas son la base de la recuperación efectiva de información, sistemas de recomendación y procesos de descubrimiento de conocimiento. El acceso a la información en las ciencias sociales va a la zaga de otros campos (por ejemplo, las ciencias naturales) en los que se dispone de más datos de citas.

El proyecto EXCITE tiene por objeto subsanar este vacío mediante el desarrollo de una cadena de herramientas de software para la extracción de referencias que se aplicará a las bases de datos científicas existentes (especialmente a los textos completos de ciencias sociales). Las herramientas están a disposición de otros investigadores. El proyecto desarrolla una serie de algoritmos para extraer referencias y citas de textos completos en PDF.

La extracción de citas se llevará a cabo en cinco pasos:

1) Extracción del texto de los documentos de origen,

2) Identificación de las secciones de referencia en el texto,

3) Segmentación de referencias individuales en campos como autor, título, etc.,

4) Cotejo de las cadenas de referencia con bases de datos bibliográficas,

5) Exportación de las referencias cotejadas en formatos y servicios utilizables.

En un futuro el proyecto prestará especial atención a la optimización de los componentes individuales de la extracción de citas. Esto se hará con la ayuda de métodos de aprendizaje automático que controlen la calidad de los datos extraídos de los componentes individuales. Los datos de citación extraídos se integrarán en los servicios y se publicarán como datos abiertos vinculados bajo licencias abiertas para permitir su reutilización. El software resultante de este proyecto se publicará bajo licencias de código abierto y se hará accesible a través de una API de WebService.

Excite integra y desarrolla métodos y los aplica en varias plataformas.