Historia del proyecto Google Books

wu-google-books1

«La base de datos de Google Books estaba en continuo y rápido crecimiento. En marzo de 2007 tenía digitalizado un millón de libros. En 2010 anunciaban haber escaneado 15 millones de los 130 millones de libros que estimaban que habría en el mundo en ese momento. Estamos hablando de algo más del 10% del conocimiento impreso del planeta escaneado página a página, organizado y almacenado en menos de una década.

Nadie puede negar a nuestros románticos jóvenes que son temerarios y, sobre todo, innovadores. Cuenta Richard. L. Brant en su libro Las dos caras de Google (Editorial Viceversa, 2010) que ya en 2002 Larry Page decidió averiguar el tiempo necesario para escanear un libro de 300 páginas. Acompañado por la entonces jefa de Producto de Google, Marissa Mayer, se encerró en su despacho con una cámara de fotos y un cronometro. Larry hacía fotografías mientras Marissa pasaba las páginas. Así comprobaron que el tiempo estimado era de 40 minutos, lo que representaba su primer hándicap: escanear millones de obras debería ser un trabajo mucho más rápido. Si querían lograr algún día su objetivo, deberían innovar e idear una manera mucho más eficiente, y a su vez respetuosa con los originales, para poder hacerlo.

Y lo consiguieron. Larry formó un equipo de trabajo y visitaron proyectos de digitalización por todo el mundo. Unió al equipo a expertos en robótica que pudieran diseñar una máquina para pasar las páginas y escanear a gran velocidad sin dañar los ejemplares. Los ingenieros de Google crearon un software de reconocimiento de caracteres que detectara hasta los más extraños e inusuales tipos y tamaños de texto. Aparentemente, lo consiguieron. Años más tarde, cuando la rectora de la Universidad de Michigan, Mary Sue Coleman, le confesó a Larry Page que los archivos de la universidad, que consistían en siete millones de libros, podían escanearse en un período de tiempo no inferior a mil años, éste, sin inmutarse, le replicó que Google podría hacerlo en seis.

Nadie sabe a cierta ciencia qué hardware emplean para el proyecto Google Books. Se especula que escanean a una velocidad de mil páginas por minuto con cámaras Ephel 323. Resulta curioso no saber a ciencia cierta cómo funciona un proyecto cuya finalidad es, precisamente, poner a nuestra disposición conocimiento. Como ya has visto en otras ocasiones, Google tiene mucho interés en devorar y apropiarse de la información, pero no tanto en que los demás conozcamos la suya propia, que suele estar protegida por rigurosos acuerdos de confidencialidad.»

Alejandro Suárez Sánchez-Ocaña

«Desnudando a Google»

	¿Es el artículo cien… en OpenEval: la inteligencia arti…
	¿Es el artículo cien… en PaperOrchestra: cuando la inte…
	ATHENEA EGEA AHIJADO en Supuestos prácticos de oposici…
	Noticias IA y Educac… en Aprender para el futuro: educa…
	IA en bibliotecas: d… en Implementación de un chatbot d…

Universo Abierto

Blog de la biblioteca de Traducción y Documentación de la Universidad de Salamanca

Historia del proyecto Google Books

Comparte esto: