Estas asociaciones de palabras influyen directamente en las búsquedas webs

El sexismo de Google hace que ellos sean médicos y ellas, enfermeras
Microsoft, ha testeado la base de datos vectorial de Google y ha descubierto que es claramente sexista.


6 ago. 2016 15:00H
SE LEE EN 2 minutos
POR REDACCIÓN
Cuando el gigante tecnológico Google puso a trabajar, allá por 2013, una red neuronal sobre un campo de tres millones de palabras extraídas de los textos de Google News, nada hacía presagiar que se obtuvieran unos resultados tan sexistas. Su objetivo era obtener patrones en la manera en la que las palabras aparecen juntas en los textos y para ilustrar el resultado diseñaron una gráfica vectorial.   

Si atendemos a dichos vectores, nos encontramos con que las palabras con significados similares ocupan partes similares de este espacio vectorial. Veamos un ejemplo. Hombre es para rey, lo que mujer es para reina. Hasta ahí, todos contentos. Este conjunto de datos se llama Word2vec y es altamente potente. Tiene muchas aplicaciones en el mercado, como por ejemplo, para mejorar la traducción automática o las búsquedas web inteligentes.

Uno de sus competidores más directos, Microsoft, ha testeado esta base de datos vectorial y ha descubierto que es claramente sexista. El investigador de la Universidad de Boston (EEUU) Tolga Bolukbasi, junto a varios compañeros de la división Research de la compañía, aseguran que al plantearle a la base de datos la ecuación 'padre-médico= madre-X', ésta contestará 'X = enfermera". Y a la pregunta 'hombre-ordenador = mujer-X' devuelve 'X = ama de casa'.

El equipo de Bolukbasi asegura que el resultado les sorprendió, pues los textos están escritos por periodistas. Preocupados por las implicaciones que esto puede tener, decidieron manipular con herramientas matemáticas este espacio vectorial. Y es que cualquier sesgo contenido en parejas de palabras como las de Word2vec son automáticamente transferidos a cualquier aplicación que explote ese conjunto de datos. Por ejemplo, si las palabras "médico oncólogo” se asocian más  con hombres que con mujeres, entonces una búsqueda web con las palabras clave "currículum vitae de médico oncólogo" podría eliminar a las candidatas féminas.

Bolukbasi ha explicado que los sesgos de las palabras embebidas reflejan el comportamiento de la sociedad, pero al conseguir reducir esta diferenciación en los sistemas informáticos esperan que las parejas de palabras sin sesgo puedan contribuir a reducir el sexismo.  
¿Quieres seguir leyendo? Hazte premium
¡Es gratis!
¿Ya eres premium? Inicia sesión
Las informaciones publicadas en Redacción Médica contienen afirmaciones, datos y declaraciones procedentes de instituciones oficiales y profesionales sanitarios. No obstante, ante cualquier duda relacionada con su salud, consulte con su especialista sanitario correspondiente.