Archivo de la etiqueta: Google

Google implementará una función similar a Reader al navegador Chrome

Google will bring Reader-esque feature to Chrome Browser.  Chrome Unboxed, 2022

Ver noticia

Internet lamentó colectivamente la muerte de Google Reader en 2013, y desde entonces, hemos estado tratando de encontrar la manera una herramienta similar para trabajar con los «feeds» de Twitter, Reddit, o el uso de otros lectores de RSS. Después de 9 años después Google está experimentando con una función muy similar dentro de Chrome.

En febrero del año pasado, Chrome Story descubrió una forma de seguir sitios web y temas utilizando Google Chrome en Android. Simplemente había que navegar hasta el sitio, tocar el menú de 3 puntos de la parte superior derecha, desplazarse hasta la parte inferior y tocar «Seguir». Una vez que se añadía un sitio web a la lista de sitios seguidos, se podía ver en la página de la nueva pestaña de Chrome para Android, justo al lado de la sección «Descubrir». Este feed «Seguir» no sustituye exactamente a Google Reader, ya que le faltan funciones como la de marcar artículos como leídos, pero es un paso en la dirección correcta. Esta característica se extenderá también a la versión de escritorio de Chrome, permitiendo que aquellos que usamos Chrome podamos aprovecharla al máximo.

Cómo descubren los lectores el contenido de las publicaciones académicas: tendencias del comportamiento de los lectores 2005-2021

Gardner,Tracy and Inger, Simon. How Readers Discover Content in Scholarly Publications: Trends on reader behaviour 2005-2021. Publishers Consults, 2021

Texto completo

Datos

Este informe es el resultado de una encuesta a gran escala sobre los lectores de publicaciones académicas y su comportamiento en el descubrimiento de artículos de revistas y vídeos. La encuesta se realizó durante los meses de enero, febrero y marzo de 2021.

Muchas instituciones de todo el mundo utilizan proxies para acceder a los contenidos académicos y la autenticación suele estar muy integrada con una solución institucional de inicio de sesión único (SSO), lo que dificulta que las herramientas de análisis de los editores identifiquen información cuestiones como el país de origen del lector.

La navegación del lector también es complicada. Hay trayectos simples y directos, por supuesto, tal vez desde Google hasta el contenido, o desde las redes sociales hasta el contenido. Pero cuando interviene la tecnología de las bibliotecas, los servidores de enlaces ocultan al sitio web de destino (es decir, al editor) el origen de la navegación del lector.

Esta encuesta se basa en encuestas anteriores realizadas por los autores en 2005, 2008, 2012, 2015 y 2018. Se ha incluido un análisis longitudinal y de tendencias a lo largo del tiempo cuando es pertinente hacerlo. Los sutiles cambios a lo largo del tiempo en las preferencias de los lectores proporcionan una valiosa información sobre la navegación de los lectores, las características que encuentran útiles en los sitios web de los editores y el papel y la eficacia de las tecnologías bibliotecarias. En la sección 6 Metodología y en la sección 7 Datos demográficos, se puede encontrar un análisis completo de la metodología de la encuesta y de los datos demográficos de los encuestados.

Conclusiones

Sigue habiendo diferencias regionales y sectoriales muy significativas en la forma en que los lectores descubren los contenidos académicos. En los últimos tres años se han producido algunos cambios interesantes en la forma de descubrir los contenidos académicos. Podemos ver que los principales recursos de descubrimiento, como Google Scholar, Google, A&I (predominantemente en ciencias de la vida y medicina) y la biblioteca, siguen teniendo una importancia crucial, pero hay diferencias en cuanto a la importancia dependiendo de las áreas temáticas, el sector y la región. Google Scholar domina ahora, al menos, en el sector académico.

En términos de tendencia general, los A&Is siguen siendo la herramienta de búsqueda más importante para las personas de los países de renta alta que trabajan en el amplio campo de las ciencias de la vida. Esto es así desde 2005. Sin embargo, Google Scholar se está poniendo al día.

Google Scholar es, con diferencia, el recurso de búsqueda más importante para las personas que trabajan y estudian en el área amplia de las Humanidades y las Ciencias Sociales. La biblioteca sigue siendo mucho más importante para este grupo de personas que para las personas de las materias STEM (científicas, técnicas, de ingeniería), pero se ha vuelto menos importante con el tiempo. Google Scholar sigue siendo el motor de búsqueda más utilizado para la búsqueda de revistas en Estados Unidos y en la mayoría de los países europeos. También es el motor de búsqueda más popular para el descubrimiento de revistas en China, aunque la popularidad de Baidu continúa.

Los lectores descubren los artículos a través de una búsqueda en un 45% de los casos. El 55% de las veces están haciendo otra cosa. Sin embargo, el descubrimiento a través de la búsqueda ha aumentado con el tiempo.

Los sitios de redes sociales y profesionales han aumentado significativamente en importancia, aunque menos en América del Norte, donde el crecimiento en importancia ha sido más lento que en todas las demás partes del mundo.

Se observa que la gente, sobre todo la de los países más pobres, busca activamente contenidos de acceso abierto, por lo que los editores y proveedores de tecnología deben tenerlo en cuenta a la hora de diseñar sus sitios web y gestionar la distribución de metadatos a terceros. La gente encuentra la versión de registro, incluso cuando utiliza repositorios como PMC, repositorios institucionales o redes sociales científicas como ResearchGate en su proceso inicial de descubrimiento de artículos.

La gente busca activamente artículos de acceso abierto, y no es de extrañar que la riqueza de su país tenga un impacto en esto. Los habitantes de los países más pobres buscan más contenidos de acceso abierto que los de los países más ricos. Las personas del sector empresarial buscan contenidos de acceso abierto con más frecuencia que sus homólogos del sector académico y médico.

El 80% de las descargas de artículos son consideradas por los lectores como la versión de registro. Dado que sólo alrededor del 40% de las descargas de artículos se obtienen de recursos controlados por los editores, suponemos que los lectores acceden a los artículos de la Versión de Registro desde los repositorios.

Los servidores PrePrint no son tan importantes como otros métodos de descubrimiento, salvo en el caso de la Física, donde el arXiv, de gran prestigio, sigue siendo una fuente crucial de descubrimiento de contenido académico. Los medios sociales son cada vez más importantes, pero no en todos los sectores ni en todos los países. Alrededor de la mitad de los artículos se descubren como resultado de una búsqueda, en lugar de encontrar el artículo de otra manera, por ejemplo, a través de una recomendación de un colega o de las redes sociales. Las recomendaciones de personas y máquinas son importantes, ya que vemos que la función de artículos relacionados en el sitio web de una revista sigue siendo la más popular de las enumeradas.

La principal conclusión es que todavía no hay un único actor dominante en el descubrimiento de contenidos y que las diferencias de región, sector y área temática influirán en la forma de descubrir los contenidos. Los editores que necesiten maximizar su visibilidad global deben trabajar con las opciones de descubrimiento que dominan de región a región y de sector a sector.

Google no es una biblioteca

«Google, como plataforma que prácticamente inventó el capitalismo de la vigilancia, no es una biblioteca. Podríamos describirlo más exactamente como la antítesis de una institución cívica, en el sentido de que su objetivo final es la explotación, más que el servicio, de la comunidad. Independientemente de la cantidad de páginas que se capturen en su índice de búsqueda, o de los sectores tecnológicos que monopolice, Google no merece ninguna confianza, ni autoridad, en la esfera pública.»

Mark Hurst

Public libraries are better than Google
By Mark Hurst • August 27, 2021

El lado oscuro de Google: historia y futuro de la industria de los metadatos

Macchia, María Grazia, Giuseppe Mai, y colectivo Ippolita. El lado oscuro de Google: Historia y futuro de la industria de los metadatos. Barcelona : Virus Editorial, 2010., 2010

Texto completo

Entre las bondades que Google difunde de sí misma no están las 133 webs censuradas en Europa, el sometimiento a las presiones censoras del Gobierno chino o la cancelación de la publicidad del grupo ecologista Oceana 36 para evitar problemas con uno de sus inversores: la Royal Caribbean Cruise Lines. Solo tres ejemplos de como Google Corporation viola los principios de neutralidad y libertad de acceso y expresión en la Red para salvaguardar sus propios intereses. La imagen sobria y luminosa de su página principal oculta un reverso más prosaico y turbio en el que se adentra El lado oscuro de Google. «Don’t be evil» (no seas malo), el lema de cabecera de la multinacional que quiso ser un «gigante bueno», entra en abierta contradicción con la agresividad de su política empresarial. El fichaje multimillonario del directivo de Microsoft Kai Fu-Lee, depositario de importantes secretos industriales, o la oferta de 50 millones de dólares a AOL a cambio de romper su contrato con Yahoo!, muestran hasta qué punto Google ha asimilado las reglas de juego de las grandes corporaciones. Pero en su estrategia de expansión, Google también se aprovecha de la filosofía del software libre para su propio beneficio. Hace un uso selectivo del código abierto para modificar programas cuyas mejoras no hace públicas, pone a disposición libre de los programadores herramientas que le permiten controlar y apropiarse del trabajo realizado con ellas, y ofrece a sus trabajadores un 20% del tiempo de trabajo para investigaciones propias, que pasan a ser propiedad exclusiva de la empresa. Desde que en 1996 Larry Page y Sergei Brin desarrollaron uno de los algoritmos más famosos y mejor guardados del mundo, el Page Rank(TM), Google ha consolidado su carácter de gran empresa hasta convertirse en el principal aspirante al monopolio de la información en la era digital. Esto, en parte, ha sido posible gracias a los gigantescos ingresos proporcionados por un modelo de publicidad personalizada, basada en los perfiles que la máquina Google dibuja de los usuarios, utilizando el rastro que éstos dejan con el empleo diario del buscador y otros servicios de uso gratuito. El colectivo Ippolita muestra la clara ambición hegemónica de Google y, con ella, uno de los principales peligros de nuestra era: la concentración en unas pocas manos del acceso a la información y la tecnología, poniendo en riesgo un sinfín de derechos ya coartados en el mundo material y seriamente amenazados en el espacio virtual.

Google va a convertir los libros electrónicos en audiolibros

Google is going to convert ebooks to audiobooks
GoodEReader. December 8, 2020 By Michael Kozlowski

Ver noticia

Las principales editoriales están publicando más audiolibros que nunca. Es un esfuerzo costoso, así que sólo los más populares serán narrados profesionalmente, ya que los costos son altos. Google reconoce que muchos títulos de primera y segunda línea nunca se convertirán en un audiolibro propiamente dicho y ha desarrollado un sistema beta que empleará la IA y narradores autogenerados. Esto proporcionará básicamente a los autores independientes y a todo tipo de compañías editoriales hacer ediciones de audio automáticamente.

Google está trabajando con editoriales de EE.UU. y el Reino Unido que poseen los derechos de los libros. Se puede aprovechar una serie de tecnologías existentes de Google para potenciar esta función. También utiliza una combinación de texto a voz y voces naturales basadas en WaveNet que pueden manejar nombres complejos, fechas, horas y otros textos de forma autónoma. Las personalizaciones que van desde el tono a la velocidad de la voz y la ganancia de volumen están disponibles en el servicio Cloud TTS que se ofrece a todos los desarrolladores hoy en día. A principios de este año, el Asistente de Google en los teléfonos obtuvo una función de «leer esta página» con voces especialmente adecuadas para el contenido. Google selecciona la prosa más adecuada para esa narración – rapidez, entonación y ritmo -.

Ha habido muchos avances en TTS, usando una combinación de varios sistemas de todo el imperio de Google. El proceso de conversión de ebooks a audiolibros y el hecho de que sea lo suficientemente bueno, hace que la gente pague dinero por ellos, y probablemente menos dinero que uno narrado profesionalmente.

Google declaró que la herramienta de edición «está actualmente en fase beta» y estará disponible para todos los editores a principios del próximo año.

Google marca las fronteras en los mapas dependiendo del país desde donde se mire

 

2a0ea2b8f3b5aabdae2a4d52f598e8e3

 “Google Redraws the Borders on Maps Depending on Who’s Looking”. Washington Post

Texto completo

 

La misión corporativa de Google es «organizar la información del mundo», pero también la dobla a su voluntad. Desde Argentina hasta el Reino Unido e  Irán, las fronteras del mundo se ven diferentes dependiendo de dónde las esté viendo. Esto se debe a que Google, y otros creadores de mapas en línea, simplemente los cambian.

Así, cuando se trata de fronteras disputadas, las personas en diferentes países a menudo ven cosas diferentes.  Por ejemplo, el mar entre Japón y la península de Corea para casi todos, es conocido como el Mar de Japón, pero para los usuarios de Google Maps en Corea del Sur, está catalogado como  el Mar del Este.

A más de 4,000 millas de distancia, la vía fluvial que separa a Irán de Arabia Saudita puede ser el Golfo Pérsico o el Golfo Arábigo, dependiendo de quién busque en línea. Y la línea del  Sáhara Occidenta que marca la frontera norte con Marruecos desaparece para los marroquíes que la buscan en la Web, junto con el nombre completo de la región. La región escasamente poblada del noroeste de África se disputa entre Marruecos y los propios saharauis, que se apoderó de ella en 1975 cuando era Colonia española.

 

Google Parent prueba una herramienta gratuita para ayudar a los periodistas a detectar fotografías manipuladas

5210285b15d

Assembler

Assembler,  la herramienta de Google analiza imágenes utilizando detectores, tecnología capacitada para identificar tipos específicos de manipulación, y evalúa si las imágenes pueden haber sido alteradas y dónde.

 

La desinformación hoy implica campañas de influencia sofisticadas y dirigidas, a menudo lanzadas por los gobiernos, con el objetivo de influir en eventos sociales, económicos y militares en todo el mundo. Pero a medida que las tácticas de desinformación evolucionaban, también lo hacen las tecnologías utilizadas para detectar y finalmente detener la desinformación.

La empresa matriz de Google, Alphabet, lanzó el martes una herramienta gratuita para que los periodistas identifiquen fotos que han sido manipuladas.

Jigsaw, una subsidiaria de Alphabet enfocada en tecnología de punta, anunció la nueva herramienta, llamada Assembler, en una publicación de blog.

Assembler, que se creó en coordinación con Google Research y expertos, combina múltiples detectores de imágenes para identificar si se han utilizado métodos comunes de manipulación de imágenes en una foto.

La herramienta se probará con varios medios, incluidos Agence France-Presse y el sitio de noticias filipino Rappler, antes de estar ampliamente disponible para los periodistas.

 

 

Historia del proyecto Google Books

wu-google-books1

 

 

«La base de datos de Google Books estaba en continuo y rápido crecimiento. En marzo de 2007 tenía digitalizado un millón de libros. En 2010 anunciaban haber escaneado 15 millones de los 130 millones de libros que estimaban que habría en el mundo en ese momento. Estamos hablando de algo más del 10% del conocimiento impreso del planeta escaneado página a página, organizado y almacenado en menos de una década.

Nadie puede negar a nuestros románticos jóvenes que son temerarios y, sobre todo, innovadores. Cuenta Richard. L. Brant en su libro Las dos caras de Google (Editorial Viceversa, 2010) que ya en 2002 Larry Page decidió averiguar el tiempo necesario para escanear un libro de 300 páginas. Acompañado por la entonces jefa de Producto de Google, Marissa Mayer, se encerró en su despacho con una cámara de fotos y un cronometro. Larry hacía fotografías mientras Marissa pasaba las páginas. Así comprobaron que el tiempo estimado era de 40 minutos, lo que representaba su primer hándicap: escanear millones de obras debería ser un trabajo mucho más rápido. Si querían lograr algún día su objetivo, deberían innovar e idear una manera mucho más eficiente, y a su vez respetuosa con los originales, para poder hacerlo.

Y lo consiguieron. Larry formó un equipo de trabajo y visitaron proyectos de digitalización por todo el mundo. Unió al equipo a expertos en robótica que pudieran diseñar una máquina para pasar las páginas y escanear a gran velocidad sin dañar los ejemplares. Los ingenieros de Google crearon un software de reconocimiento de caracteres que detectara hasta los más extraños e inusuales tipos y tamaños de texto. Aparentemente, lo consiguieron. Años más tarde, cuando la rectora de la Universidad de Michigan, Mary Sue Coleman, le confesó a Larry Page que los archivos de la universidad, que consistían en siete millones de libros, podían escanearse en un período de tiempo no inferior a mil años, éste, sin inmutarse, le replicó que Google podría hacerlo en seis.

Nadie sabe a cierta ciencia qué hardware emplean para el proyecto Google Books. Se especula que escanean a una velocidad de mil páginas por minuto con cámaras Ephel 323. Resulta curioso no saber a ciencia cierta cómo funciona un proyecto cuya finalidad es, precisamente, poner a nuestra disposición conocimiento. Como ya has visto en otras ocasiones, Google tiene mucho interés en devorar y apropiarse de la información, pero no tanto en que los demás conozcamos la suya propia, que suele estar protegida por rigurosos acuerdos de confidencialidad.»

 

Alejandro Suárez Sánchez-Ocaña

«Desnudando a Google»

Larry Page y Sergei Brin dejan sus cargos directivos en Alphabet, la gestora de Google

 

google

 

 

Larry Page y Sergei Brin, los dos chicos que fundaron Google hace más de 20 años  cuando estudiaban informática en la Universidad de Stanford, apenas han sido vistos ni escuchados en la última media década, desde que reestructuraron la empresa para crear la empresa matriz de Google, Alphabet. La gran sorpresa ha surgido hace unos días cuando anunciaron su retirada de la dirección de Google, dejando a Sundar Pichai a cargo de un nuevo Google.

 

Page y Brin se conocieron en la Universidad de Stanford en 1995, ya que ambos estaban en el programa de graduados en ciencias de la computación de la escuela. El origen de Google es una historia sobre el origen de una idea, y esa idea fue la visión de Page de que un motor de búsqueda en la World Wide Web podría clasificar los enlaces en función de la frecuencia con la que están vinculados por otras páginas. Con la ayuda de Brin, la idea se convirtió en PageRank, el algoritmo fundamental de Google Search. El producto de búsqueda se puso en marcha en la red de Stanford en 1996. Al principio lo  llamaron BackRub, ya que se basaba en los vínculos o links llamados de retroceso, que ayudaban a categorizar la importancia de los sitios web a través del algoritmo llamado PageRank, en homenaje a Larry Page, Aunque en 1997  cambiaron el nombre a Google, haciendo honor al término matemático «gúgol», que es el número 10 elevado a la potencia de 100. El dominio google.com fue registrado el 15 de septiembre de 1997.

Page y Brin intentaron vender Google por 1 millón de dólares a la empresa de portales de Internet Excite en 1999, como recordó el fundador de Khosla Ventures, Vinod Khosla. El prominente inversor de capital de riesgo pudo negociar con Page y Brin hasta llegar a los 750.000 dólares, pero el director ejecutivo de Excite, George Bell, no aceptó el trato. También intentaron vender el producto a Yahoo, entonces más conocido como motor de búsqueda que como operador de correo. El valor actual de Google es de casi 913.000 millones de dólares.

Hoy Google es el buscador más utilizado en todo el mundo, con una cuota de mercado del 92%, mientras que otros buscadores conocidos, como Bing y Yahoo, tienen solo una cuota de mercado de entre el 2% y el 3%

El martes día 2 de diciembre por la tarde, Page y Brin lanzaron un bombazo: tceden el control de Alphabet al actual director ejecutivo de Google, Sundar Pichai, y se están alejan de la administración de Google para siempre. La noticia, aunque parecía un gran avance, parecía inevitable. Page y Brin no han estado profundamente involucrados en las operaciones diarias de la compañía durante algún tiempo. Page y Brin mantendrán sus acciones de control y asientos en el consejo de administración, y ambos planean mantener una comunicación regular con Pichai.

Es un final apropiado para dos de los líderes tecnológicos más misteriosos de su generación, que están retirándose de su compañía con un valor de casi un billón de dólares en capitalización de mercado. El gigante de la búsqueda en Internet está enfrentado un creciente cuestionamiento por parte de sus empleados, organizaciones de medios, activistas, reguladores y legisladores, y muchas de esas controversias son problemas que se iniciaron desde la creación de la plataforma por Page y Brin, ya sea porque no previó las formas en las que Google podría hacer daño o porque dirigieron explícitamente a la empresa en una dirección al límite de la ética corporativa.

En ese contexto, es importante recordar los grandes momentos de las carreras de ambos  y cómo las acciones que emprendieron han tenido un gran impacto no sólo en la industria tecnológica, sino también en Internet y en la propia sociedad en general. Lo que Page y Brin han construido probablemente durará décadas, y saber cómo Google llegó a donde está hoy será una pieza importante en el rompecabezas de averiguar a dónde va en el futuro.

 

Google cambia su algoritmo de búsqueda hacia el“emparejamiento neuronal” para comprender mejor los conceptos de búsqueda

 

google-rankbrain-neural-matching-1553258600

 

Google acaba de anunciar recientemente que está utilizando un algoritmo de «emparejamiento neuronal» para comprender mejor los conceptos que transformará el futuro escenario de resultados de búsqueda, técnicas de optimización de motores de búsqueda y estrategias. El anterior algoritmo «RankBrain» relacionaba las páginas con los conceptos y el emparejamiento neuronal relaciona las palabras con las búsquedas

 

Google está utilizando la tecnología AI para generar diversos resultados de búsqueda analizando mejor los términos de la consulta. El Algoritmo de Correspondencia o emparejamiento Neural (Neural Matching) de Google es una mezcla perfecta de técnicas de optimización de motores de búsqueda y motores artificiales. Ahora, Google se centrará en los sinónimos y el concepto que hay detrás del término de búsqueda.

El nuevo algoritmo de Google va a influir en las antiguas técnicas de optimización de motores de búsqueda y proporcionará resultados más completos. Porque Google se centrará en entender el concepto de la página a partir del contenido en lugar de basarse en las palabras clave. Anteriormente Google solía recoger las palabras clave de la página para entender el concepto.

El último trabajo de investigación se titula Deep Relevance Ranking, que utiliza la Enhanced Document Query Instruction (Instrucción de consulta de documentos mejorada). cuyo objetivo es eliminar el spam y los resultados irrelevantes y rastrear los resultados de búsqueda relevantes. Con todo ello, la búsqueda en línea va a ser la más personalizada que nunca, ya que Google podrá entender las preguntas y los términos de búsqueda exactos. En septiembre de 2018, Google declaró que el emparejamiento neuronal ya se utiliza en el 30% de las búsquedas.

RankBrain relaciona las páginas con los conceptos y el emparejamiento neural relaciona las palabras con las búsquedas. El algoritmo RankBrain ayuda a Google a relacionar las páginas con conceptos, incluso cuando las páginas no incluyen las palabras exactas utilizadas en una consulta. También es un sistema basado en la IA que ha estado en uso desde 2016, dos años antes de que Google implementara el emparejamiento neuronal.