CÓMO LOS ALGORITMOS DISCIERNEN NUESTRO ESTADO DE ÁNIMO POR LO QUE ESCRIBIMOS ONLINE
Investigadores y empresas están utilizando los ordenadores para identificar las emociones tras nuestras palabras escritas. Aunque el análisis de sentimientos está lejos de ser prefecto, consigue destilar significados de enorme cantidades de datos y un día podría incluso evaluar la salud mental.
Dana Mackenzie
EL SALTO
30 SEP 2020
Mucha gente
ha declarado a 2020 como el peor año de la historia. Aunque una descripción de
este tipo puede parecer irremediablemente subjetiva, según una medida es
cierta.
Esa referencia es el Hedonómetro, una forma
computerizada de evaluar tanto nuestra felicidad como nuestro desaliento.
Funciona día a día en ordenadores de la Universidad de Vermont (UVM), donde
reúne alrededor de 50 millones de tuits de Twitter y después da una lectura
rápida del estado de ánimo del público. Según el Hedonómetro, 2020 ha sido de
largo el año más horrible desde que empezó a hacer seguimiento en 2008.
El Hedonómetro es una encarnación relativamente
reciente de una tarea en la que los informáticos han estado trabajando durante
más de 50 años: usar los ordenadores para evaluar el tono emocional de las
palabras. Para construir el Hedonómetro, el informático de la UVM Chris
Danforth tuvo que enseñar a una máquina a entender las emociones tras esos
tuits ya que ningún humano tendría posibilidad de leerlos todos. Este proceso,
llamado análisis de sentimientos, ha hecho grandes avances en años recientes y
está encontrando cada vez más usos.
Además de tomar la temperatura emocional del
usuario de Twitter, los investigadores están empleando el análisis de
sentimientos para medir las percepciones de la gente del cambio climático y
para examinar sabiduría convencional como, en la música, si un acorde menor es
más triste que un acorde mayor (y cuánto más). Los negocios que codician
información sobre los sentimientos de los consumidores están utilizando el
análisis de sentimientos para evaluar críticas en plataformas como Yelp.
Algunos lo están usando para medir los estados de ánimo de los empleados en las
redes sociales internas en funcionamiento. La técnica puede tener también
aplicaciones médicas, como identificar a las personas deprimidas que necesitan
ayuda.
El análisis de sentimientos está permitiendo a los
investigadores examinar una avalancha de datos que era previamente larga y
difícil de recoger, por no hablar de estudiar, dice Danforth. “En la ciencia
social tendemos a medir cosas que son fáciles, como el producto interior bruto.
La felicidad es una cosa importante que es difícil de medir”.
DECONSTRUIR EL ‘GUISO DE PALABRAS’
Podrías pensar que el primer paso en el análisis de
sentimientos sería enseñar al ordenador a entender lo que están diciendo los
humanos. Pero eso es algo que los informáticos no pueden hacer: entender el
lenguaje es uno de los problemas notoriamente difíciles en la inteligencia
artificial. Pero hay abundantes claves para las emociones tras un texto
escrito, que los ordenadores pueden reconocer incluso sin entender el
significado de las palabras.
El enfoque más temprano al análisis de sentimientos
es el recuento de palabras. La idea es bastante sencilla: contar el número de
palabras positivas y restar el número de palabras negativas. Una medida incluso
mejor puede obtenerse pesando las palabras: “Excelente”, por ejemplo, conlleva
un sentimiento más fuerte que “bueno”. Estos pesos son generalmente asignados
por expertos humanos y son parte de la creación de los diccionarios
palabra-emoción, llamados lexicons, que el análisis de sentimientos a menudo
utilizan.
Los informáticos están usando algoritmos de aprendizaje automático
que enseñan a un programa informático a reconocer pautas, como las relaciones
significativas entre palabras
Pero el recuento de palabras tiene problemas
inherentes. Uno es que ignora el orden de las palabras, tratando a una frase
como una especie de guiso de palabras. Y el recuento de palabras puede pasar
por alto señales específicas del contexto. Considera esta crítica de producto:
“Estoy tan feliz de que mi iPhone no sea como mi viejo y feo Droid”. La frase
tiene tres palabras negativas (‘no’, ‘viejo’ y ‘feo’) y sólo una positiva
(‘feliz’). Mientras que un humano reconoce inmediatamente que ‘viejo’ y ‘feo’
se refieren a un teléfono diferente, para el ordenador, parece negativo. Y las
comparaciones presentan dificultades adicionales: ¿Qué significa ‘no sea como’?
¿Significa que el hablante no está comparando el iPhone con el Android? El
lenguaje puede ser muy confuso.
Para abordar estos asuntos, los informáticos han
recurrido cada vez más a enfoques más sofisticados que dejan a los humanos
completamente al margen. Están usando algoritmos de aprendizaje automático que
enseñan a un programa informático a reconocer pautas, como las relaciones
significativas entre palabras. Por ejemplo, el ordenador puede aprender que
parejas de palabras como ‘banco’ y ‘parque’ a menudo se dan juntas. Estas
asociaciones pueden dar claves respecto a significado o sentimiento. Si ‘banco’
y ‘dinero’ están en la misma frase, probablemente sea un tipo de banco
diferente.
Un gran paso en estos métodos se dio en 2013,
cuando Tomas Mikolov, de Google Brain, aplicó el aprendizaje automatizado para
construir una herramienta llamada Word Embeddings (incrustaciones de palabras).
Ésta convierte cada palabra en una lista de 50 a 300 números, llamada vector.
Los números son como una huella que describe una palabra, y concretamente las
otras palabras a las que tiende a frecuentar.
Para obtener estos descriptores, el programa de
Mikolov miró millones de palabras en artículos de prensa e intentó predecir la
siguiente palabra de texto, dadas las palabras previas. Las incrustaciones de
Mikolov reconocen sinónimos: palabras como ‘dinero’ o ‘efectivo’ tienen
vectores muy parecidos. Más sutilmente, las Word Embeddings capturan analogías
elementales ─que rey es a reina lo que chico es a chica, por ejemplo─ aunque no
pueden definir esas palabras (una hazaña remarcable dado que tales analogías
eran parte de cómo los exámenes de acceso a la universidad en EEUU evaluaban el
desempeño).
Las Word Embeddings de Mikolov eran generadas por
lo que se llama una red neuronal con una capa oculta. Las redes neuronales, que
están ligeramente modeladas según el cerebro humano, han permitido increíbles
avances en el aprendizaje automatizado, incluido AlphaGo (que aprendió a jugar
al juego de go mejor que el campeón del mundo). La red de Mikolov era una red
deliberadamente más superficial, así que podía ser útil para variedades tareas,
como traducción y análisis de temas.
Las redes neuronales más profundas, con más capas
de cortex, pueden extraer incluso más información sobre el sentimiento de una
palabra en el contexto de una frase o documento concretos. Una tarea de
referencia común es que el ordenador lea la crítica de una película en IMDB y
prediga si el crítico la aprobó o suspendió. Los primeros métodos de léxico
consiguieron cerca del 74% de precisión. Los más sofisticados llegaron al 87%.
Las primeras redes neuronales, en 2011, consiguieron el 89%. Hoy actúan con más
del 94% de precisión ─acercándose a la de un humano. (El humor y el sarcasmo
siguen siendo grandes escollos, porque las palabras escritas pueden expresar
literalmente lo contrario del sentimiento que se pretende).
A pesar de los beneficios de las redes neuronales,
los métodos basados en léxico son todavía populares; el Hedonómetro, por
ejemplo, usa un léxico, y Danforth no tiene intención de cambiarlo. Aunque las
redes neuronales pueden ser más precisas para algunos problemas, vienen con un
coste. Sólo el periodo de formación es una de las tareas informáticamente más
intensas que puedes pedir hacer a un ordenador.
Pacientes diagnosticados con depresión tenían estilos de escritura
distintivos, como el uso de los pronombres ‘yo’ y ‘mí’ más a menudo
“Básicamente, estás limitado por cuánta
electricidad tienes”, dice Robert Stine, de Wharton School, que cubre la
evolución del análisis de sentimientos en el Annual Review of Statistics and
Its Application de 2019. “¿Cuánta electricidad utilizó Google para preparar
AlphaGo? El chiste que escuché fue que la suficiente como para cocer el
océano”, dice Stine.
Además de las necesidades de electricidad, las
redes neuronales requieren hardware caro y conocimiento técnico, y hay una
falta de transparencia porque el ordenador está descifrando cómo abordar la
tarea, más que siguiendo las instrucciones explícitas de un programador. “Es
más fácil corregir errores con un léxico”, dice Bing Liu, de la Universidad de
Illinois en Chicago, uno de los pioneros del análisis de sentimientos.
MEDIR LA SALUD MENTAL
Aunque el análisis de sentimientos cae a menudo en
la esfera de los informáticos, tiene profundas raíces en la psicología. En
1962, el psicólogo de Harvard Philip Stone desarrolló el General Inquirer, el
primer programa informatizado de análisis de textos de carácter general para
utilización en psicología; en los 90, el psicólogo social James Pennebaker
desarrolló un temprano programa para análisis de sentimientos (el Linguistic
Inquiry and Word Count) como mirada a los mundos psicológicos de la gente.
Estas primeras evaluaciones revelaron y confirmaron pautas que los expertos
habían observado desde hace tiempo: pacientes diagnosticados con depresión
tenían estilos de escritura distintivos, como el uso de los pronombres ‘yo’ y
‘mí’ más a menudo. Usaban más palabras con afectividad negativa, y a veces más
palabras relacionadas con la muerte.
Hay todavía trabajo que hacer para mostrar cuán útiles son estos
análisis: muchos estudios que evalúan la salud mental no consiguen definir sus
términos adecuadamente
Los investigadores están ahora examinando la
expresión de la salud mental en el lenguaje y la escritura analizando
publicaciones en redes sociales. Andrew Reece, psicólogo de Danforth y Harvard,
por ejemplo, analizó las publicaciones de Twitter de personas con diagnósticos
formales de depresión o desorden por estrés post-traumático que fueron escritos
antes de la diagnosis (con el consentimiento de los participantes). Empezaron a
aparecer signos de depresión hasta nueve meses antes. Y Facebook tiene un
algoritmo para detectar usuarios que parecen estar en riesgo de suicidio;
expertos humanos revisan los casos y, si corresponde, envían a los usuarios
indicaciones o números de ayuda telefónica.
PREDECIR LA DEPRESIÓN DE LOS TUITS
Pero los datos de redes sociales están todavía muy
lejos de ser usados en atención al paciente. Los temas de privacidad son una
inquietud obvia. Además, hay todavía trabajo que hacer para mostrar cuán útiles
son estos análisis: muchos estudios que evalúan la salud mental no consiguen
definir sus términos adecuadamente o no proporcionan suficiente información
como para replicar sus resultados, dice Stevie Chancellor, una experta en
informática centrada en las personas de la NorthWestern University y coautor de
una crítica reciente de 75 estudios de este tipo. Pero aun así cree que el
análisis de sentimientos podría ser útil clínicamente, por ejemplo al hacer el
triaje de un nuevo paciente. E incluso sin datos personales, el análisis de
sentimientos puede identificar tendencias como el nivel general de estrés de
estudiantes universitarios durante una pandemia, o los tipos de interacciones
en redes sociales que disparan las recaídas entre las personas con desórdenes
alimenticios.
LEER LOS ESTADOS DE ÁNIMO
El análisis de sentimientos también está abordando
cuestiones más desenfadadas, como los efectos del clima sobre el estado de
ánimo. En 2016, Nick Obradovich, ahora en el Instituto Max Planck para el
Desarrollo Humano de Berlín, analizó alrededor de 2.000 millones de
publicaciones de Facebook y mil millones de publicaciones en Twitter. Un poco
de lluvia rebajaba la felicidad expresada por la gente alrededor de un 1%. Las
temperaturas bajo cero la rebajaban alrededor del doble. En un estudio de
seguimiento ─y más desalentador─, Obradovich y otros colegas miraron Twitter
para entender los sentimientos sobre el cambio climático. Descubrieron que tras
cinco años de aumento del calor, la sensación de los usuarios de Twitter de lo
‘normal’ cambió y ya no tuiteaban sobre una ola de calor. No obstante, la
sensación de bienestar de los usuarios aún era afectada, muestran los datos.
“Es un problema que progresa tan despacio que no se percibe”, dice Obradovich.
“Ése fue uno de los descubrimientos empíricos más preocupantes que nunca he
hecho”.
Aunque ‘lunes’ es el nombre de día que suscita las reacciones más
negativas, el martes era en realidad el día en que la gente estaba más triste
La reputación del lunes como peor día de la semana
también requirió investigación. Aunque ‘lunes’ es el nombre de día que suscita
las reacciones más negativas, el martes era en realidad el día en que la gente
estaba más triste, descubrió un temprano análisis de tuits por el Hedonómetro
de Danforth. El viernes y el sábado, por supuesto, eran los días más felices.
Pero la pauta semanal cambió tras las elecciones presidenciales estadounidenses
de 2016. Aunque probablemente todavía hay una señal semanal, “superpuesta sobre
ella están acontecimientos que atrapan nuestra atención y se habla sobre ellos
más que sobre lo básico de la vida”, dice Danforth. Traducción: en Twitter, la
política nunca para. “Cualquier día de la semana puede ser el más triste”,
dice.
Otro tópico puesto a prueba es que en la música,
los acordes mayores se perciben como más alegres que los acordes menores.
Yong-Yeol Ahn, un experto en ciencia social informática de la Universidad de
Indiana, puso a prueba esta idea analizando el sentimiento de las letras que
acompañan a cada acorde en 123.000 canciones. Los acordes mayores de hecho
estaban asociados con palabras más alegres, 6,3 comparado con 6,2 para los
acordes menores en una escala de 1 a 9. Aunque la diferencia parece pequeña, es
aproximadamente la mitad de la diferencia de sentimiento entre Navidad y un día
de la semana normal en el Hedonómetro. Ahn también comparó los géneros y
descubrió que el rock de los 60 era el más feliz; el heavy metal era el más
negativo.
SAGACIDAD EMPRESARIAL
El mundo de los negocios también está asumiendo la
herramienta. El análisis de sentimientos se está volviendo ampliamente usado
por las empresas, pero muchas no hablan sobre ello así que precisamente
aumentar su popularidad es difícil. “Todas lo están haciendo: Microsoft,
Google, Amazon, todas. Algunas de ellas tienen múltiples grupos de
investigación”, dice Liu. Una medida de interés de fácil acceso es el gran
número de programas de software de análisis de sentimientos comerciales y
académicos que están disponibles públicamente: una comparación de referencia de
2018 detalló 28 programas de este tipo.
Algunas empresas usan el análisis de sentimientos
para entender lo que sus clientes están diciendo en las redes sociales. Como
ejemplo posiblemente apócrifo, Expedia Canada llevó a cabo una campaña de
márketing en 2013 que se hizo viral de la forma equivocada, porque la gente
odiaba la chirriante música de violín de fondo. Expedia sustituyó rápidamente
el molesto anuncio con nuevos vídeos que se reían del antiguo (por ejemplo,
invitaron a un disgustado usuario de Twitter a destrozar el violín). Se afirma
frecuentemente que Expedia fue alertada de la respuesta de las redes sociales
por el análisis de sentimientos. Aunque esto es difícil de confirmar,
ciertamente es el tipo de cosa que el análisis de sentimientos podría hacer.
Otras empresas utilizan el análisis de sentimientos
para hacer seguimiento de la satisfacción de la plantilla, por ejemplo,
monitoreando las redes sociales internas de la empresa. IBM, por ejemplo,
desarrolló un programa llamado Social Pulse que hacía seguimiento de la
intranet de la compañía para ver de qué se estaban quejando los empleados. Por
motivos de privacidad, el software sólo miraba a las publicaciones que se
compartían con toda la empresa. Incluso así, esta tendencia molesta a Danforth,
quien dice: “Mi preocupación sería que la privacidad de los empleados no
estuviera en consonancia con la esencia de la empresa. Es una cosa éticamente
dudosa”.
Es probable que la ética siga siendo un problema a
medida que el análisis de sentimientos se vuelve más común. Y las empresas, los
profesionales de la salud mental y de cualquier otro campo que consideren su
uso deberían tener en mente que aunque el análisis de sentimientos es
infinitamente prometedor, cumplir esa promesa puede ser difícil todavía. Las matemáticas
que subyacen a los análisis son la parte fácil. La parte difícil es entender a
los humanos. Como dice Liu, “Ni siquiera entendemos lo que es entender”.
Knowable Magazine
Artículo original: How algorithms discern our mood
from what we write online, publicado el licencia creative
commons y traducido por Eduardo Pérez para El Salto.
*++
No hay comentarios:
Publicar un comentario