Book Genome, un interesante proyecto que permite determinar una especie de ADN de cada libro, analizando lenguaje, tema y personajes.

50-sombrasdegrey

Book Genome

Todo un ejemplo de como el formato digital permite realizar estudios precisos sobre lengua y contenidos. Disponiendo de 50 Sombras de Grey en formato de eBook, es interesante ver lo que tiene para decir un algoritmo que analiza bloques de texto en busca de contenido sexual. Debajo, una representación gráfica del contenido sexual del libro, separado en bloques de aproximadamente 1000 palabras. El análisis fue producido por el Book Genome, un interesante proyecto fundado en 2003 que permite determinar una especie de ADN de cada libro, analizando lenguaje, tema y personajes. El bloque verde significa contenido apto para todo público. Amarillo es un bloque con cierto contenido sexual. Rojo es acción triple X.

dna-fools-crow

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s