Aprendizaje automático: una máquina lee 3.5 millones de libros para caracterizar los adjetivos asociados a hombres y mujeres

medium_jsrnhtviwvejrnvmer-gfv20pekaqivvqa3p7akuqxw

Alexander Hoyle , Lawrence Wolf-Sonkin , Hanna Wallach , Isabelle Augenstein , Ryan Cotterell. Unsupervised Discovery of Gendered Language through Latent-Variable Modeling. In Proceedings of the Annual Meeting of the Association for Computational Linguistics, 2019

Texto completo

 

Estudiar en qué medida el lenguaje que utilizamos es específico de género ha sido durante mucho tiempo un área de interés en sociolingüística. En este trabajo se analiza este fenómeno, para cuantificar el grado en que el lenguaje utilizado para describir a hombres y mujeres es diferente, y además, diferente de manera positiva o negativa. Encontramos que existen diferencias significativas entre la forma en que se describen los sustantivos masculinos y femeninos, lo que está en consonancia con los estereotipos de género más comunes: Los adjetivos positivos usados para describir a las mujeres tienen más probabilidades de estar relacionados con el cuerpo de una persona que los adjetivos que describen a los hombres.

 

Una máquina leyó 3.5 millones de libros y luego contó lo que pensaba sobre hombres y mujeres para descubrir que los adjetivos atribuidos a las mujeres tienden a describir la apariencia física, mientras que las palabras que se refieren al comportamiento se atribuyen a los hombres.

“Hermoso” y “sexy” son dos de los adjetivos más utilizados para describir a las mujeres. Los descriptores de uso común para los hombres incluyen justos, racionales y valientes.

Los investigadores revisaron una enorme cantidad de libros en un esfuerzo por descubrir si hay una diferencia entre los tipos de palabras que describen a hombres y mujeres en la literatura. Utilizando un nuevo modelo de computadora, los investigadores analizaron un conjunto de datos de 3.5 millones de libros, todos publicados en inglés entre 1900 y 2008. Los libros incluyen una mezcla de literatura de ficción y no ficción.

Podemos ver claramente que las palabras utilizadas para las mujeres se refieren mucho más a sus apariencias que las palabras utilizadas para describir a los hombres. Por lo tanto, hemos podido confirmar una percepción generalizada, solo que ahora a nivel estadístico ”, dice la científica informática y profesora asistente Isabelle Augenstein, del departamento de informática de la Universidad de Copenhague.