Archivo de la etiqueta: Motores de búsqueda

Brave Summarizer, una herramienta de IA para sintetizar resultados de Brave Search 

Brave Search

El Resumidor proporciona respuestas concisas y precisas en la parte superior de las páginas de resultados de Brave Search, en respuesta a la información introducida por el usuario, basándose únicamente en los resultados de las búsquedas en la Web. A diferencia de un modelo de IA puramente generativo, propenso a soltar afirmaciones sin fundamento, eliminando los grandes modelos lingüísticos (LLM) para procesar múltiples fuentes de información presentes en la Web. Esto produce una respuesta más concisa y precisa, expresada en un lenguaje coherente.

Además, la procedencia de las fuentes originales de datos se cita en todo momento mediante enlaces. De este modo se mantiene la legítima atribución de la información y se ayuda a los usuarios a evaluar la fiabilidad de las fuentes, dos elementos necesarios para mitigar los sesgos de autoridad de los grandes modelos lingüísticos.

Además del resumen en sí, nuestros modelos de IA también son capaces de sustituir los fragmentos (descripciones de resultados) ya dependientes de la consulta por una versión resumida de esos fragmentos, resaltando la respuesta cuando es posible. Esto puede verse como un resumen de una sola fuente (como un artículo de prensa), a diferencia del resumen principal, en el que se consideran y agregan múltiples fuentes para crear una respuesta más completa. El resumen de la parte superior de la página de resultados y estas descripciones especiales coinciden, por lo que los usuarios verán el resumen general y los fragmentos con las respuestas resaltadas.

La carrera por construir un motor de búsqueda basado en ChatGPT

«The Race to Build a ChatGPT-Powered Search Engine | WIRED». Accedido 9 de febrero de 2023.

Ver completo

Impulsados por el entusiasmo que suscita ChatGPT, los titanes de las búsquedas en Internet, así como varias empresas emergentes, siguen adelante. Microsoft, que ha invertido unos 10.000 millones de dólares en OpenAI, creador de ChatGPT, está a punto de incorporar la tecnología subyacente a Bing, su segundo motor de búsqueda. Google, que lleva tiempo trabajando en un chatbot similar llamado LaMDA, se apresura a reaccionar. Baidu, el principal motor de búsqueda de China, está trabajando en un bot en chino similar a ChatGPT.

JIANG CHEN, experto en aprendizaje automático que trabajó anteriormente en Google, quedó hipnotizado cuando probó por primera vez ChatGPT, el chatbot de OpenAI extraordinariamente coherente y aparentemente bien informado que se ha convertido en una sensación en Internet.

Pero el aura de poder de la tecnología se atenuó cuando Chen intentó utilizar la misma tecnología de inteligencia artificial subyacente para crear una herramienta de búsqueda mejor para la startup que cofundó, Moveworks. La empresa utiliza la IA para ayudar a los empleados a buscar información, como documentos de asistencia técnica y páginas de recursos humanos. La nueva herramienta de búsqueda de Chen era excelente para extraer todo tipo de información útil de esos documentos, incluidas direcciones y números de teléfono, pero algunos de ellos no eran reales. «Su capacidad de fabricación es asombrosa», afirma Chen.

Es comprensible el entusiasmo que ha despertado ChatGPT y las sugerencias generalizadas de que podría reinventar los motores de búsqueda. El chatbot puede dar respuestas complejas y sofisticadas a preguntas sintetizando la información de miles de millones de palabras extraídas de Internet y otras fuentes para entrenar sus algoritmos. Juguetear con el bot puede dar la sensación de experimentar una forma más fluida de interactuar con las máquinas.

Pero la forma en que funciona esta tecnología es, en cierto modo, fundamentalmente contraria a la idea de un motor de búsqueda que recupere de forma fiable la información que se encuentra en Internet. Ya hay mucha información inexacta en la red, pero ChatGPT genera fácilmente nuevas falsedades. Sus algoritmos subyacentes no se basan directamente en una base de datos de hechos o enlaces, sino que generan cadenas de palabras destinadas a parecerse estadísticamente a las vistas en sus datos de entrenamiento, sin tener en cuenta la verdad. Otro problema de un sistema como ChatGPT es que sus respuestas se basan únicamente en los datos con los que fue entrenado. Volver a entrenar el modelo en su totalidad puede costar millones de dólares debido a su tamaño y a la escala de los datos.

A pesar de este reto, y quizás impulsados por el entusiasmo que suscita ChatGPT, los titanes de las búsquedas en Internet, así como varias empresas emergentes, siguen adelante. Microsoft, que ha invertido unos 10.000 millones de dólares en OpenAI, creador de ChatGPT, está a punto de incorporar la tecnología subyacente a Bing, su segundo motor de búsqueda.

Google, que lleva tiempo trabajando en un chatbot similar llamado LaMDA, se apresura a reaccionar. Tiene previsto lanzar pronto una versión de LaMDA y es posible que demuestre este año hasta 20 productos que utilizan la misma tecnología. Baidu, el principal motor de búsqueda de China, está trabajando en un bot en chino similar a ChatGPT.

Mientras los gigantes tecnológicos preparan sus respuestas a la emergencia de ChatGPT, varias startups han lanzado motores de búsqueda con interfaces de chat similares al bot. Entre ellas se encuentran You.com, Perplexity AI y Neeva.

Las herramientas que han construido ilustran tanto el potencial como el reto de adaptar la tecnología del estilo ChatGPT a las búsquedas. You.com, fundada por Richard Socher, experto en lenguaje e IA, puede ofrecer respuestas a través de una interfaz de chat. Las respuestas vienen acompañadas de citas, que pueden ayudar al usuario a rastrear el origen de una información.

No está claro cuánto tiempo llevará inventar y probar estas soluciones. Puede que pase algún tiempo antes de que la tecnología pueda cambiar radicalmente la forma en que la gente busca respuestas, incluso si se dan otros casos de uso, como idear nuevas recetas o servir de compañero de estudio o programación.

Microsoft desafiará a Google al integrar ChatGPT con Bing Search

Microsoft to challenge Google by integrating ChatGPT with Bing search.
By Tom Warren / @tomwarren, Jan 4, 2023, 11:31 AM GMT+1

Ver

Según se informa, Microsoft planea lanzar una versión de Bing que usa ChatGPT para responder consultas de búsqueda. The Information  informa que Microsoft espera lanzar la nueva función antes de finales de marzo en un intento por hacer que Bing sea más competitivo con Google.

Al usar la tecnología ChatGPT, creada por la empresa de inteligencia artificial OpenAI, Bing podría proporcionar respuestas más humanas a las preguntas en lugar de solo enlaces a información.

Microsoft tiene una estrecha relación con OpenAI, una de las empresas de IA líderes en el mundo. El gigante tecnológico con sede en Redmond está agregando un  modelo de texto a imagen de IA  a Bing impulsado por DALL-E 2 de OpenAI; invirtió mil millones de dólares en OpenAI  en 2019; y tiene una  licencia exclusiva para usar su generador de texto AI GPT-3 . Aún no está claro cómo este último acuerdo puede ayudar a la rumoreada integración de Bing de ChatGPT.

La compañía con sede en Redmond, Washington, puede implementar la función adicional en los próximos meses, pero aún está sopesando la precisión del chatbot y la rapidez con la que se puede incluir en el motor de búsqueda. El lanzamiento inicial puede ser una prueba limitada para un grupo reducido de usuarios, agregó la persona.

Ask a Question: haz cualquier pregunta y obtén respuestas directamente de los artículo de investigación

Ask a Question

https://scite.ai/search?mode=question-answering

Este nuevo servicio de scite permite que usuarios formulen preguntas de investigación en lenguaje sencillo y obtengan respuestas directamente del texto completo de los artículos de investigación. Se trata de encontrar información fiable y científica. Piensa en todas las preguntas que te has planteado y en lo difícil que ha sido encontrar una respuesta fiable. Tal vez te hayas preguntado si las camas de bronce aumentan el riesgo de cáncer, o si beber agua corriente tiene efectos negativos para la salud.

Los resultados no aparecen resumidos ni generados por la IA, sino que son fragmentos de artículos de texto completo que escribieron y publicaron investigadores reales. La búsqueda de «Ask a Question» permite plantear preguntas frecuentes como éstas en términos sencillos y humanos. Monstrándo los resultados directamente desde el texto completo de más de 32 millones de artículos de investigación que tienen la respuesta que buscas, o al menos una pista que te indique la dirección correcta.

El objetivo es que podemos obtener la información que necesitamos sin preocuparnos por los anuncios, las fuentes de información poco fiables o las complicados formulaciones de los motores de búsqueda académica.

scite es una empresa emergente con sede en Brooklyn que ayuda a los investigadores a descubrir y comprender mejor los artículos de investigación a través de Smart Citations, es decir, citas que muestran el contexto de la cita y describen si el artículo aporta pruebas de apoyo o de contraste. scite es utilizado por estudiantes investigadores de todo el mundo y está financiado en parte por la National Science Foundation y el National Institute on Drug Abuse de los National Institutes of Health.

El lado oscuro de Google: historia y futuro de la industria de los metadatos

Macchia, María Grazia, Giuseppe Mai, y colectivo Ippolita. El lado oscuro de Google: Historia y futuro de la industria de los metadatos. Barcelona : Virus Editorial, 2010., 2010

Texto completo

Entre las bondades que Google difunde de sí misma no están las 133 webs censuradas en Europa, el sometimiento a las presiones censoras del Gobierno chino o la cancelación de la publicidad del grupo ecologista Oceana 36 para evitar problemas con uno de sus inversores: la Royal Caribbean Cruise Lines. Solo tres ejemplos de como Google Corporation viola los principios de neutralidad y libertad de acceso y expresión en la Red para salvaguardar sus propios intereses. La imagen sobria y luminosa de su página principal oculta un reverso más prosaico y turbio en el que se adentra El lado oscuro de Google. «Don’t be evil» (no seas malo), el lema de cabecera de la multinacional que quiso ser un «gigante bueno», entra en abierta contradicción con la agresividad de su política empresarial. El fichaje multimillonario del directivo de Microsoft Kai Fu-Lee, depositario de importantes secretos industriales, o la oferta de 50 millones de dólares a AOL a cambio de romper su contrato con Yahoo!, muestran hasta qué punto Google ha asimilado las reglas de juego de las grandes corporaciones. Pero en su estrategia de expansión, Google también se aprovecha de la filosofía del software libre para su propio beneficio. Hace un uso selectivo del código abierto para modificar programas cuyas mejoras no hace públicas, pone a disposición libre de los programadores herramientas que le permiten controlar y apropiarse del trabajo realizado con ellas, y ofrece a sus trabajadores un 20% del tiempo de trabajo para investigaciones propias, que pasan a ser propiedad exclusiva de la empresa. Desde que en 1996 Larry Page y Sergei Brin desarrollaron uno de los algoritmos más famosos y mejor guardados del mundo, el Page Rank(TM), Google ha consolidado su carácter de gran empresa hasta convertirse en el principal aspirante al monopolio de la información en la era digital. Esto, en parte, ha sido posible gracias a los gigantescos ingresos proporcionados por un modelo de publicidad personalizada, basada en los perfiles que la máquina Google dibuja de los usuarios, utilizando el rastro que éstos dejan con el empleo diario del buscador y otros servicios de uso gratuito. El colectivo Ippolita muestra la clara ambición hegemónica de Google y, con ella, uno de los principales peligros de nuestra era: la concentración en unas pocas manos del acceso a la información y la tecnología, poniendo en riesgo un sinfín de derechos ya coartados en el mundo material y seriamente amenazados en el espacio virtual.

Google plantea un nuevo buscador que proporcionará respuestas en lenguaje natural como si se tratara de un experto en la materia a partir de fuentes fiables y fidedignas.

Ejemplo de búsqueda en la web (izquierda), modelo lingüístico (centro) y respuestas de expertos (sistema previsto)

Metzler, D., Tay, Y., Bahri, D., & Najork, M. Rethinking Search: Making Experts out of Dilettantes. arXiv:2105.02274 [cs], 2021. http://arxiv.org/abs/2105.02274

Un nuevo artículo de cuatro investigadores de Google propone un sistema «experto» capaz de responder con autoridad a las preguntas de los usuarios en lugar de presentar una lista de posibles resultados de búsqueda, basado en el algoritmo GPT-3 presentado el año pasado. Este enfoque podría cambiar no sólo el funcionamiento de los motores de búsqueda, sino también lo que hacen, y la forma en que interactuamos con ellos.

El documento, titulado Rethinking Search: Making Experts out of Dilettantes, sugiere que la forma actual de presentar al usuario una lista de resultados de búsqueda en respuesta a una consulta es una «carga cognitiva», y propone mejoras en la capacidad de un sistema de procesamiento del lenguaje natural (PLN) para dar una respuesta autorizada y definitiva que sustituya el enfoque de clasificación por un modelo de respuesta experta en lenguaje de inteligencia artificial (IA).

La mayoría de los motores de búsqueda siguen funcionando de la misma manera que hace 20 años: las páginas web son indexadas por rastreadores (software que lee la web sin parar y mantiene una lista de todo lo que encuentra), los resultados que coinciden con la consulta de un usuario se recogen de este índice, y los resultados se clasifican por relevancia. Hasta ahora las búsquedas en Google se han basado en el algoritmo Page Rank para arrojar los resultados de búsqueda a partir de la calidad y cantidad de los enlaces que le dan otras páginas a una página determinada. El problema es que los motores de búsqueda actuales siguen respondiendo con una lista de documentos que incluyen la información solicitada, no con la información en sí, si no con una lista de referencias. Según Metzler, es como si pidieras consejo a tu médico y recibieras una lista de artículos para leer en lugar de una respuesta directa. Por ello, Google se está replanteando este método por el de una búsqueda basada en un nuevo algoritmo de lenguaje denominado GPT-3. El nuevo algoritmo extrae información de múltiples fuentes para responder a las preguntas en lenguaje natural. Lo que proporcionará al usuario de una búsqueda, no la lista de los resultados más relevantes como ocurre ahora, si no una respuesta en lenguaje natural como si se tratara de un experto en la materia a partir de fuentes fiables y fidedignas.

Metzler y sus colegas están interesados en un motor de búsqueda que se comporte como un experto humano «Debería producir respuestas en lenguaje natural, sintetizadas a partir de más de un documento, y respaldar sus respuestas con referencias a pruebas de apoyo, como pretenden hacer los artículos de Wikipedia». Y añade: «Cuando existe una necesidad de información, los usuarios desearían preguntar a un experto, pero a menudo recurren a un sistema de recuperación de información, como un motor de búsqueda. Los sistemas clásicos de recuperación de información no responden directamente a las necesidades de información, sino que proporcionan referencias a respuestas (que se espera sean autorizadas). Los sistemas de respuesta a preguntas de éxito ofrecen un corpus limitado creado a la carta por expertos humanos, que no es ni oportuno ni escalable». En cambio, los grandes modelos lingüísticos pre entrenados son capaces de generar directamente una prosa que puede responder a una necesidad de información, pero en la actualidad son más aficionados que expertos: no tienen una verdadera comprensión del mundo; y lo que es más importante, son incapaces de justificar sus enunciados haciendo referencia a documentos de apoyo en el corpus sobre el que fueron entrenados (ver imagen). El artículo examina cómo las ideas de la recuperación de información clásica y los grandes modelos lingüísticos pueden sintetizarse y evolucionar hacia sistemas que realmente cumplan la promesa del asesoramiento experto.

Búsquedas efectivas en internet: motores de búsqueda, metadatos y SEO

Visualizar video Facebook Live

Programa Noches de Biblioteca – Búsquedas efectivas en internet: motores de búsqueda, metadatos y SEO Invitado especial: Julio Alonso Arévalo, Jefe de Biblioteca de la Facultad de Traducción y Documentación de la Universidad de Salamanca.

«Hubo un tiempo en que lo que más tarde se conoció como Internet no era más
que un oscuro experimento para conectar computadoras. Un tiempo antes de
que Internet se convirtiera en un elemento omnipresente de la vida cotidiana de
miles de millones de personas. Un tiempo antes de que casi todos los dispositivos
imaginables pudieran conectarse con todo tipo de otros dispositivos a través de
Internet. Y una época en la que las conexiones entre personas las definíamos por
el espacio físico y la interacción física. Un tiempo antes de que nos consideráramos
ciudadanos de la web social. Ese tiempo se acabó para siempre


Jacques Raubenheimer

¿Cómo funciona internet y los motores de búsqueda? Planeta Biblioteca 2021/05/19.

¿Cómo funciona internet y los motores de búsqueda?

Planeta Biblioteca 2021/05/19.

ESUCHAR EL PROGRAMA

Ir a descargar

Presentación PPS

Los buscadores web funcionan mediante la “orden” de búsqueda con palabras clave, imágenes o voz. Primero el usuario introduce los datos, acto seguido, los motores de búsqueda responden con un listado de páginas web relacionado con el contenido buscado. Para ello la herramienta utiliza los comúnmente denominados “robots”, o “spiders”, que rastrean todas las páginas web para crear una gran base de datos con la que proporcionar toda la información al usuario

Microsoft está cerrando Microsoft Academic Search y los servicios relacionados

Next Steps for Microsoft Academic – Expanding into New Horizons

Complete Blog Post

Microsoft está planeando cerrar el maravilloso y poderoso Microsoft Academic Search (que utiliza el también maravilloso Microsoft Academic Graph) a finales de 2021

En algunos casos Microsoft Academic Search proporciona/proporciona mejores resultados que Google Scholar junto con una serie de características que GS no proporciona en absoluto. La conclusión es que tener una variedad de herramientas entre las que elegir siempre es algo bueno.

Desde su relanzamiento a principios de 2016, este recurso de búsqueda gratuito ha demostrado ser increíblemente útil, no solo como herramienta de búsqueda independiente, sino también como un corpus de material que se puede buscar a través de otras herramientas, como Lens.org.

Motores de búsqueda: una mecánica de técnicas algorítmicas

Rieder, B. [e-Book] Engines of Order : A Mechanology of Algorithmic Techniques, Amsterdam University Press, 2020.

Texto completo

El software se ha convertido en un componente clave de la vida contemporánea y los algoritmos que ordenan, clasifican o recomiendan están por todas partes. Partiendo de la filosofía de Gilbert Simondon y de la tradición de las técnicas culturales, este libro examina el carácter constructivo y acumulativo del software y recorre las trayectorias históricas de una serie de técnicas algorítmicas que se han convertido en los bloques de construcción de las prácticas contemporáneas de ordenación. Desarrolladas en oposición a siglos de tradición bibliotecaria, estas técnicas instancian formas de conocimiento dinámicas, perspectivistas e interesadas. Incrustadas en infraestructuras técnicas y lógicas económicas, se han convertido en motores de orden que transforman el modo en que organizamos la información, las ideas y las personas.

En las últimas décadas, y en particular desde la adopción generalizada de Internet, los encuentros con los procedimientos algorítmicos para la «recuperación de información» -la actividad de obtener alguna pieza de información de una colección o repositorio de algún tipo- se han convertido en experiencias cotidianas para la mayoría de las personas en grandes partes del mundo.