Archivo de la etiqueta: Recuperación de la información

Ask a Question: haz cualquier pregunta y obtén respuestas directamente de los artículo de investigación

Ask a Question

https://scite.ai/search?mode=question-answering

Este nuevo servicio de scite permite que usuarios formulen preguntas de investigación en lenguaje sencillo y obtengan respuestas directamente del texto completo de los artículos de investigación. Se trata de encontrar información fiable y científica. Piensa en todas las preguntas que te has planteado y en lo difícil que ha sido encontrar una respuesta fiable. Tal vez te hayas preguntado si las camas de bronce aumentan el riesgo de cáncer, o si beber agua corriente tiene efectos negativos para la salud.

Los resultados no aparecen resumidos ni generados por la IA, sino que son fragmentos de artículos de texto completo que escribieron y publicaron investigadores reales. La búsqueda de «Ask a Question» permite plantear preguntas frecuentes como éstas en términos sencillos y humanos. Monstrándo los resultados directamente desde el texto completo de más de 32 millones de artículos de investigación que tienen la respuesta que buscas, o al menos una pista que te indique la dirección correcta.

El objetivo es que podemos obtener la información que necesitamos sin preocuparnos por los anuncios, las fuentes de información poco fiables o las complicados formulaciones de los motores de búsqueda académica.

scite es una empresa emergente con sede en Brooklyn que ayuda a los investigadores a descubrir y comprender mejor los artículos de investigación a través de Smart Citations, es decir, citas que muestran el contexto de la cita y describen si el artículo aporta pruebas de apoyo o de contraste. scite es utilizado por estudiantes investigadores de todo el mundo y está financiado en parte por la National Science Foundation y el National Institute on Drug Abuse de los National Institutes of Health.

Búsqueda bibliográfica: cómo repensar las formas de buscar, recopilar y analizar la producción científica escrita

Martinovich, Viviana. Búsqueda bibliográfica : cómo repensar las formas de buscar, recopilar y analizar la pro-ducción científica escrita. 1a ed. – Remedios de Escalada : De la UNLa – Universidad Nacional de Lanús, 2022

Text completo

Apéndice

Desde diversas áreas de investigación, la palabra “bibliografía” suele ser utilizada para designar el listado de referencias consultadas o el listado de textos propuestos para un curso, pero lo cierto es que la bibliografía es un campo de estudios en sí mismo, una disciplina con tradiciones, rupturas y discusiones internas, de la cual los distintos tipos de trabajos de “revisión bibliográfica” tomaron históricamente prestado muchas de sus características esenciales. Sin embargo, mientras que, en la década de 1980, la bibliografía como disciplina rompió con sus propios moldes descriptivos y enumerativos, los distintos tipos de estudios que toman la bibliografía como insumo siguen atrapados en su impronta de contabilizar, enumerar y describir existencias. Entonces ¿por qué no intentar recuperar las nuevas perspectivas de la bibliografía, de la historia y de la sociología de los textos para enriquecer las formas en que las diversas áreas del conocimiento analizan las producciones textuales?; ¿por qué no abordar la propia narrativa científica con la riqueza con que ciertas áreas de las ciencias analizan otras producciones discursivas?; ¿es posible hacer este proceso sin repensar las formas de recuperar e interpretar esa bibliografía? Entendemos que enriquecer las formas de interpretar los textos nos demanda repensar las formas en que buscamos e interpretamos ese recorte de fuentes escritas que componemos y este es el camino que les proponemos transitar.

Evaluación de las tareas de recuperación y acceso a la información

Sakai, Tetsuya, et al., editores. Evaluating Information Retrieval and Access Tasks : NTCIR’s Legacy of Research Impact. Springer Nature, 2021. 

Texto completo

Este libro de acceso abierto resume las dos primeras décadas de los bancos de pruebas y la comunidad para la investigación del acceso a la información (NTCIR). El NTCIR es una serie de foros de evaluación dirigidos por un equipo mundial de investigadores y acogidos por el Instituto Nacional de Informática (NII) de Japón. El libro es único en el sentido de que analiza no sólo lo que se hizo en el NTCIR, sino también cómo se hizo y el impacto que se ha logrado. Por ejemplo, en algunos capítulos el lector ve las primeras semillas de lo que con el tiempo se convirtió en los motores de búsqueda que dan acceso a los contenidos de la World Wide Web, los actuales teléfonos inteligentes que pueden adaptar lo que muestran a las necesidades de sus propietarios y los altavoces inteligentes que enriquecen nuestra vida en casa y en movimiento. También se vislumbra cómo pueden construirse nuevos motores de búsqueda para fórmulas matemáticas o para el registro digital de una vida humana vivida.

La clave del éxito del NTCIR fue el reconocimiento temprano de que la investigación sobre el acceso a la información es una disciplina empírica y que, por lo tanto, la evaluación se encuentra en el centro de la empresa. La evaluación es, por tanto, el núcleo de cada uno de los capítulos de este libro. En ellos se muestra, por ejemplo, cómo el reconocimiento de que algunos documentos son más importantes que otros ha configurado el pensamiento sobre el diseño de la evaluación. Los treinta y tres colaboradores de este volumen hablan en nombre de los muchos cientos de investigadores de docenas de países de todo el mundo que, juntos, dieron forma al NTCIR como organizadores y participantes. Este libro es apto para investigadores, profesionales y estudiantes, es decir, para cualquiera que desee conocer los esfuerzos de evaluación pasados y presentes en la recuperación de información, el acceso a la información y el procesamiento del lenguaje natural, así como para aquellos que deseen participar en una tarea de evaluación o incluso diseñar y organizar una.

(Des)obediencia en las sociedades digitales: perspectivas sobre el poder de los algoritmos y los datos

Neuburg, Klaus, et al. (Dis)Obedience in Digital Societies: Perspectives on the Power of Algorithms and Data: 37. 2022.

Texto completo

Los algoritmos no deben considerarse como una estructura técnica, sino como un fenómeno social: se incrustan, de forma todavía muy sutil, en nuestro sistema político y social. Los algoritmos moldean el comportamiento humano en varios niveles: influyen no sólo en la recepción estética del mundo, sino también en el bienestar y la interacción social de sus usuarios. Actúan e intervienen en un contexto político y social. Como los algoritmos influyen en el comportamiento individual en estas situaciones sociales y políticas, su poder debería ser objeto de un discurso crítico, o incluso llevar a la desobediencia activa y a la necesidad de contar con herramientas y métodos adecuados que puedan utilizarse para romper el poder algorítmico

La búsqueda de información científica

La búsqueda de información científica. Biblioteca de la universidad de Alicante, 2022

Texto completo

La búsqueda de información es un proceso de carácter global en el que intervienen una serie de factores interrelacionados entre sí. La finalidad de la búsqueda y el tema sobre el que tenemos que localizar información determinan el tipo de fuentes de información que debemos consultar (estadísticas, libros, artículos de revista, tesis doctorales, patentes…) y, por tanto, los recursos que nos permiten acceder a ellas.

El desarrollo de las nuevas tecnologías y la facilidad de publicación en la red, sumado a la gran cantidad de información disponible, hacen imprescindible acudir a fuentes que nos garanticen, a través de procesos de selección previos, la recuperación de información fiable y de calidad, como por ejemplo los catálogos o las bases de datos. Por otra parte, nuestras búsquedas deben ser precisas y eficaces, para obtener los resultados más pertinentes, más adecuados a nuestras necesidades de información, de entre ese gran volumen de documentación existente. El conocimiento de una serie de técnicas de búsqueda que hemos de aplicar, con ligeras variaciones determinadas por el recurso que utilicemos, nos ayudarán a conseguir ese objetivo.

Google plantea un nuevo buscador que proporcionará respuestas en lenguaje natural como si se tratara de un experto en la materia a partir de fuentes fiables y fidedignas.

Ejemplo de búsqueda en la web (izquierda), modelo lingüístico (centro) y respuestas de expertos (sistema previsto)

Metzler, D., Tay, Y., Bahri, D., & Najork, M. Rethinking Search: Making Experts out of Dilettantes. arXiv:2105.02274 [cs], 2021. http://arxiv.org/abs/2105.02274

Un nuevo artículo de cuatro investigadores de Google propone un sistema «experto» capaz de responder con autoridad a las preguntas de los usuarios en lugar de presentar una lista de posibles resultados de búsqueda, basado en el algoritmo GPT-3 presentado el año pasado. Este enfoque podría cambiar no sólo el funcionamiento de los motores de búsqueda, sino también lo que hacen, y la forma en que interactuamos con ellos.

El documento, titulado Rethinking Search: Making Experts out of Dilettantes, sugiere que la forma actual de presentar al usuario una lista de resultados de búsqueda en respuesta a una consulta es una «carga cognitiva», y propone mejoras en la capacidad de un sistema de procesamiento del lenguaje natural (PLN) para dar una respuesta autorizada y definitiva que sustituya el enfoque de clasificación por un modelo de respuesta experta en lenguaje de inteligencia artificial (IA).

La mayoría de los motores de búsqueda siguen funcionando de la misma manera que hace 20 años: las páginas web son indexadas por rastreadores (software que lee la web sin parar y mantiene una lista de todo lo que encuentra), los resultados que coinciden con la consulta de un usuario se recogen de este índice, y los resultados se clasifican por relevancia. Hasta ahora las búsquedas en Google se han basado en el algoritmo Page Rank para arrojar los resultados de búsqueda a partir de la calidad y cantidad de los enlaces que le dan otras páginas a una página determinada. El problema es que los motores de búsqueda actuales siguen respondiendo con una lista de documentos que incluyen la información solicitada, no con la información en sí, si no con una lista de referencias. Según Metzler, es como si pidieras consejo a tu médico y recibieras una lista de artículos para leer en lugar de una respuesta directa. Por ello, Google se está replanteando este método por el de una búsqueda basada en un nuevo algoritmo de lenguaje denominado GPT-3. El nuevo algoritmo extrae información de múltiples fuentes para responder a las preguntas en lenguaje natural. Lo que proporcionará al usuario de una búsqueda, no la lista de los resultados más relevantes como ocurre ahora, si no una respuesta en lenguaje natural como si se tratara de un experto en la materia a partir de fuentes fiables y fidedignas.

Metzler y sus colegas están interesados en un motor de búsqueda que se comporte como un experto humano «Debería producir respuestas en lenguaje natural, sintetizadas a partir de más de un documento, y respaldar sus respuestas con referencias a pruebas de apoyo, como pretenden hacer los artículos de Wikipedia». Y añade: «Cuando existe una necesidad de información, los usuarios desearían preguntar a un experto, pero a menudo recurren a un sistema de recuperación de información, como un motor de búsqueda. Los sistemas clásicos de recuperación de información no responden directamente a las necesidades de información, sino que proporcionan referencias a respuestas (que se espera sean autorizadas). Los sistemas de respuesta a preguntas de éxito ofrecen un corpus limitado creado a la carta por expertos humanos, que no es ni oportuno ni escalable». En cambio, los grandes modelos lingüísticos pre entrenados son capaces de generar directamente una prosa que puede responder a una necesidad de información, pero en la actualidad son más aficionados que expertos: no tienen una verdadera comprensión del mundo; y lo que es más importante, son incapaces de justificar sus enunciados haciendo referencia a documentos de apoyo en el corpus sobre el que fueron entrenados (ver imagen). El artículo examina cómo las ideas de la recuperación de información clásica y los grandes modelos lingüísticos pueden sintetizarse y evolucionar hacia sistemas que realmente cumplan la promesa del asesoramiento experto.

Motores de búsqueda: una mecánica de técnicas algorítmicas

Rieder, B. [e-Book] Engines of Order : A Mechanology of Algorithmic Techniques, Amsterdam University Press, 2020.

Texto completo

El software se ha convertido en un componente clave de la vida contemporánea y los algoritmos que ordenan, clasifican o recomiendan están por todas partes. Partiendo de la filosofía de Gilbert Simondon y de la tradición de las técnicas culturales, este libro examina el carácter constructivo y acumulativo del software y recorre las trayectorias históricas de una serie de técnicas algorítmicas que se han convertido en los bloques de construcción de las prácticas contemporáneas de ordenación. Desarrolladas en oposición a siglos de tradición bibliotecaria, estas técnicas instancian formas de conocimiento dinámicas, perspectivistas e interesadas. Incrustadas en infraestructuras técnicas y lógicas económicas, se han convertido en motores de orden que transforman el modo en que organizamos la información, las ideas y las personas.

En las últimas décadas, y en particular desde la adopción generalizada de Internet, los encuentros con los procedimientos algorítmicos para la «recuperación de información» -la actividad de obtener alguna pieza de información de una colección o repositorio de algún tipo- se han convertido en experiencias cotidianas para la mayoría de las personas en grandes partes del mundo.

Entorno a la recuperación de la información en Internet. Plagio y Noticias Falsas

Entorno a la recuperación de la información en Internet. Plagio y Noticias Falsas

Julio Alonso Arévalo. Cajamarca (Perú). 7 nov. 2020

Conferencia – Julio Alonso Arévalo. La alfabetización digital es el conjunto de competencias necesarias para la plena participación en la sociedad del conocimiento. Incluye conocimientos, habilidades y comportamientos para propósitos de comunicación, creación y colaboración. La mayoría de los jóvenes han estado expuestos a más tecnología que las generaciones anteriores. Sin embargo eso no lesa de expertos en recuperación de la información. En la conferencia hacemos una serie de recomendaciones en torno a cómo recuperar información fiable en el entorno digital, hablamos de noticias falsas y de cómo detectar el plagio y también como evitarlo utilizando herramientas de gestión de referencias.

Metadata 2020 Proyectos de evaluación de metadatos

 

8t-c4tza_400x400

 

Habermann, Ted. Metadata 2020 Metadata Evaluation Projects. Research Ideas and Outcome (RIO) 6: e54176.
DOI: 10.3897/rio.6.e54176

Texto completo

Metadata 2020: una colaboración intercomunitaria que aboga por metadatos más ricos, conectados, reutilizables y abiertos para todos los resultados de la investigación para avanzar en las actividades académicas en beneficio de la sociedad. Un grupo de voluntarios que trabajan juntos tratando de alentar y facilitar el progreso hacia este objetivo desafiante. El gurú de la gestión Peter Druker dijo: «Si no puedes medirlo, no puedes mejorarlo». Con esto en mente, varios proyectos de Metadata 2020 examinaron los enfoques para la evaluación de metadatos y las conexiones entre evaluación y orientación. Lograr este progreso en la amplia extensión del panorama de Metadata 2020 requiere conectar dialectos de metadatos y recomendaciones de la comunidad y análisis de múltiples cuerpos de metadatos. Este documento describe un marco para abordar esa tarea y algunos ejemplos potenciales.

 

Los fundamentos del descubrimiento: Informe sobre la evaluación de los efectos del programa de catalogación de colecciones ocultas, 2008-2019

 

unnamed-1jpg__600x0_q85_subsampling-2.jpg__600x0_q85_subsampling-2

 

The Foundations of Discovery: A Report on the Assessment of the Impacts of the Cataloging Hidden Collections Program, 2008–2019. ouncil on Library and Information Resources (CLIR), September 2019

Texto completo

Informe

Datos

De 2008 a 2014, el CLIR administró el programa de Catalogación de Colecciones y Archivos Especiales Ocultos, que concedió fondos para catalogar colecciones «ocultas» de alto valor académico. Con el generoso apoyo de la Fundación Andrew W. Mellon, el programa otorgó más de 27,4 millones de dólares a instituciones académicas, de patrimonio cultural y otras instituciones coleccionistas.

Este informe describe los métodos y hallazgos del análisis, incluyendo los resultados de la catalogación, así como el impacto en la contratación, las políticas y procedimientos, las herramientas de comunicación, y la investigación y la divulgación.