«Will ChatGPT Replace the Google Search Engine?», 26 de mayo de 2023. https://www.boldare.com/blog/will-chatgpt-replace-google-search-engine.
ChatGPT ha arrasado en el sector digital, conquistando corazones y mentes por igual. Y esto ha ocurrido por una razón. Es fácil de usar, gratuito y lleno de usos potenciales. Es potente, pero no ilimitado. En pocas palabras: no, ChatGPT no sustituirá al motor de búsqueda de Google. Puede que se haga con parte del tráfico pero, al menos por ahora
ChatGPT, o modelos lingüísticos similares, son potentes herramientas para generar textos de apariencia humana y ayudar a los usuarios a encontrar información. Sin embargo, es importante señalar que ChatGPT está diseñado como agente conversacional y no como motor de búsqueda.
Google Search y ChatGPT parecen similares. Hay un campo en el que se introduce la consulta y, a continuación, se obtiene un resultado: en el caso de Google, se trata de una lista de sitios web (aunque no sólo: en los últimos años, Google ha empezado a mostrar los denominados resultados enriquecidos, que pretenden responder a la pregunta del usuario a nivel de motor de búsqueda); en el caso de ChatGPT, se trata de una respuesta completa a una pregunta determinada.
Google vs ChatGPT no se trata simplemente de una competición entre un motor de búsqueda clásico y la IA. Google lleva tiempo utilizando algoritmos de IA para responder a las consultas de los usuarios. RankBrain, Neural Matching, Bert, MUM: estos son los algoritmos de IA más populares que Google ha introducido en su motor de búsqueda en los últimos años.
BERT (Bidirectional Encoder Representations from Transformers) se lanzó en 2018 y ayuda al motor de búsqueda a procesar y comprender el lenguaje natural. Se basa en la arquitectura Transformer – al igual que el modelo GPT utilizado por ChatGPT.
¿Cómo funciona ChatGPT?
ChatGPT es un modelo lingüístico probabilístico diseñado para seguir y ejecutar instrucciones. Ha sido entrenado con un conjunto específico de datos textuales para ejecutar las instrucciones con la mayor precisión posible. Lo hace generando tokens: secuencias de caracteres y palabras, basadas en una distribución de probabilidades.
En pocas palabras, lo que hace básicamente la inteligencia artificial es analizar las estadísticas y la secuencialidad del orden de las palabras y construir cadenas con las palabras más probables. El aspecto que aún no es visible en el propio ChatGPT -pero lo será en su iteración Bing o en el modelo fuente OpenAI Playground- es la posibilidad de definir el parámetro «temperatura». Esta característica permite a los usuarios decidir cuánto puede desviarse el modelo de la información que ha aprendido de su conjunto de datos.
En la práctica, el parámetro de temperatura indica si los tokens (palabras) utilizados deben tener el nivel de probabilidad más alto. Esto tiene un enorme impacto en el efecto final. Si decide añadir sólo las palabras más probables, el resultado será muy plano, repetitivo y esquemático. Si permite el uso de tokens de menor rango, más aleatorios, obtendrá un resultado más versátil e interesante.
Los posibles errores y elucubraciones en las respuestas se deben a que, aunque los modelos se entrenan con enormes cantidades de datos textuales, no son capaces de entender el mundo de forma humana ni de verificar la veracidad de la información como harían las personas. En su lugar, se basan en estructuras lingüísticas y patrones aprendidos a partir de los datos de entrenamiento.
Por ejemplo, cuando se le pregunta sobre algún tema científico, puede citar determinados trabajos de investigación, junto con sus títulos, autores, fechas de publicación, etc. Pero una vez que se empieza a buscar esos trabajos, a menudo resulta que nunca han existido. Todo depende de cuánta información y cuántas citas sobre un tema determinado había en el corpus de texto utilizado para entrenar el modelo.
Por consiguiente, aunque el resultado generado por un modelo sea gramaticalmente correcto y suene sensato, puede contener información falsa, o información «inventada» por el modelo. De ahí viene el concepto de «alucinación»
Y por eso hay que tener en cuenta que, aunque la IA sea una herramienta poderosa para la generación de textos, sigue requiriendo supervisión y evaluación humanas, sobre todo si la información que proporciona se va a utilizar para tomar decisiones importantes o en situaciones en las que el uso de datos precisos y exactos es esencial. Por eso, utilizar ChatGPT como alternativa a los motores de búsqueda -incluido Google- está prácticamente descartado.
ChatGPT no es un motor de búsqueda, es un procesador de texto. Como su nombre indica, su función es procesar texto. También puede generar textos, pero para ello debe recibir alguna entrada o un patrón a seguir. No escribirá una entrada de blog por ti (es decir, puede hacerlo, pero el escritor debe comprobar la información generada por el chatbot). ChatGPT puede resultar útil para varios usos: puede codificar, corregir, analizar y categorizar contenidos, etcétera. Pero no funcionará como motor de búsqueda.
Aunque los modelos de IA conversacional como ChatGPT pueden proporcionar respuestas instantáneas y ayudar a los usuarios en determinadas tareas, no tienen la misma amplitud y profundidad de información que un motor de búsqueda como Google. Es más acertado considerar los modelos de IA conversacional y los motores de búsqueda como herramientas complementarias que como competidores directos. La IA conversacional puede ser útil para proporcionar respuestas rápidas y entablar conversaciones interactivas, mientras que los motores de búsqueda destacan en la recuperación de una amplia gama de información de la inmensidad de Internet.
En conclusión: Hay que tener en cuenta que la tecnología está en constante evolución y que es posible que surjan nuevos avances en el futuro. Sin embargo, por ahora, es poco probable que los modelos de IA conversacional sustituyan por completo a los motores de búsqueda como Google Search. En cambio, es probable que sigan coexistiendo y complementándose de diferentes maneras para atender las diversas necesidades de información de los usuarios.