Lo que un análisis de voz puede decirnos sobre el estado mental de Putin

Aunque los expertos piden cautela a la hora de sacar cualquier conclusión sobre Putin basándose en las limitadas muestras de habla, sí están de acuerdo en que el análisis de la voz, cuando lo realizan expertos y se utiliza con otras piezas de información vitales, tiene un enorme potencial para la atención sanitaria.

Lo que un análisis de voz puede decirnos sobre el estado de ánimo de Putin

Por Kathleen Doheny

15 de abril de 2022 C Mientras la guerra en Ucrania estallaba en intensidad, investigadores japoneses analizaron fragmentos de la voz del presidente ruso Vladimir Putin durante varias semanas. Según los investigadores, a medida que sus niveles de estrés aumentaban, su malestar mental se hacía evidente.

"El estado de la psique puede medirse a partir de los sonidos del habla", dijo Kanji Okazaki, director general de Risk Measurement Technologies en Tokio, que realizó la investigación sobre Putin y ofrece un producto de análisis de voz para ayudar a las empresas a hacer un seguimiento de la salud mental de los trabajadores.

Aunque los expertos estadounidenses piden cautela a la hora de sacar esa conclusión sobre Putin basándose en las escasas muestras de habla, están de acuerdo en que el análisis de la voz, cuando lo realizan expertos y se utiliza con otros datos vitales, tiene un enorme potencial para la atención sanitaria.

La voz, una pista milenaria sobre la salud

Escuchar la voz de una persona para evaluar su estado de salud física o mental no es algo nuevo. Los científicos saben desde hace tiempo que las enfermedades pueden afectar a órganos como los pulmones, el cerebro y el corazón, junto con los músculos y las cuerdas vocales, y a su vez pueden cambiar la voz de una persona.

Los profesionales de la salud mental saben que cuando los pacientes con depresión mejoran con el tratamiento, tienden a hablar más rápido que antes, con menos pausas, por ejemplo. Los pacientes con la enfermedad de Parkinson tienden a tener un volumen de voz bajo con una calidad monótona. Los que padecen esclerosis múltiple pueden arrastrar las palabras o tener un patrón de habla alterado, con largas pausas entre palabras.

Ahora, la tecnología de inteligencia artificial C que desarrolla sistemas informáticos para realizar tareas que normalmente necesitan de la inteligencia humana, incluso para el reconocimiento del habla C promete aumentar el potencial del análisis de la voz. Los investigadores pueden entrenar a un algoritmo para que detecte los signos de estrés en la voz, después de investigar las diferencias de la voz en una población diversa de personas y extraer las diferencias entre los estresados y los no estresados.

Los investigadores afirman que el análisis de la voz puede ayudar a diagnosticar enfermedades mentales y de otro tipo, a determinar la eficacia de los tratamientos e incluso a predecir problemas de salud como los infartos. Las empresas y los investigadores ya utilizan el análisis de la voz, y hay varias aplicaciones disponibles para que los consumidores las descarguen y utilicen en sus teléfonos inteligentes.

Análisis de Putin

Para el análisis de Putin, dice Okazaki, "el estado de las cuerdas vocales se lee a partir del sonido del habla. Cuando una persona siente tensión, bajo estrés, las cuerdas vocales se ponen rígidas. Esta es una reacción involuntaria y no puede ser controlada por uno mismo", dice. "Así, el estado de la psique puede medirse a partir de los sonidos del habla".

Como ejemplo, sugiere recordar cómo la voz se eleva o suena "apagada" cuando se está nervioso, porque la tensión hace que las cuerdas vocales se endurezcan.

Okazaki analizó más de una hora de discursos de Putin entre el 1 de febrero y el 19 de marzo, y luego los comparó con una charla tranquila que había dado en septiembre de 2020 en las Naciones Unidas, en la que elogió la cooperación internacional. El 10 de marzo, al no producirse el desenlace bélico que preveía, los niveles de estrés detectados eran un 40% superiores a los de la línea de base, según indicó Okazaki en informes anteriores.

En una entrevista por correo electrónico, Okazaki dijo que su empresa sigue analizando la voz de Putin, pero se abstiene de hacer predicciones sobre si se rendirá o cuándo lo hará.

"Hay que decir que predecir la rendición es difícil, dijo. Esto se debe a que no hay suficientes datos para hacer predicciones fiables."

Los expertos: No tan rápido

"Yo sería muy cauteloso ante cualquier sugerencia de que se pueda inferir un problema psiquiátrico [de las grabaciones del discurso de Putin]", dice el doctor Alexander S. Young, profesor y presidente interino de psiquiatría y ciencias bioconductuales de la Facultad de Medicina David Geffen de la UCLA. "De hecho, yo sugeriría en este caso no hacer ninguna sugerencia de este tipo. Se necesitaría una verdadera evaluación psiquiátrica".

El análisis de la voz es prometedor, pero tiene un camino que recorrer, dicen los expertos en la materia.

"Como científico que estudia la voz, estoy entusiasmado con su potencial", dice Satrajit S. Ghosh, doctor y principal investigador del Instituto McGovern de Investigación Cerebral del Instituto Tecnológico de Massachusetts.

Utiliza la neuroimagen, el habla y el aprendizaje automático para mejorar la evaluación y el tratamiento de la salud mental. También ha evaluado estudios publicados sobre el uso del habla para evaluar los trastornos psiquiátricos.

"El campo está en su infancia", dice. "Es muy fácil entusiasmarse con estas cosas. [Pero] creo que el campo no está lo suficientemente avanzado como para saber exactamente el tipo de información que podemos extraer de la voz en relación con el comportamiento humano."

Al igual que otros expertos, Ghosh afirma que la tecnología suscita inquietudes. Las bases de datos utilizadas en los análisis de la voz deben mejorarse, y las cuestiones de privacidad deben abordarse, dice.

En el futuro, una muestra de voz de alta calidad, por sí sola, será valiosa, pero la ciencia tiene que evolucionar, dice el doctor Reza Hosseini Ghomi, neuropsiquiatra de la Universidad de Washington y director médico de Brain Check, una plataforma tecnológica de salud cognitiva. Aunque dice que el análisis de la voz será útil en todos los ámbitos, y ha investigado su uso para la depresión, dice que un enfoque más práctico es en condiciones como la demencia y la pérdida de la función de las células nerviosas.

"En esos casos, tengo una verdad a la que apuntar", dice, refiriéndose a las pruebas de acumulación de placas en el cerebro que pueden respaldar los hallazgos del análisis de la voz.

A la hora de diagnosticar el estado de salud mental de alguien, incluido Putin, la voz no es lo único importante que hay que calibrar, dice la doctora Lillian Glass, experta en comunicación y lenguaje corporal de Los Ángeles. Considerar sólo la voz, dice, "es como mirar [sólo] la cola del elefante cuando se intenta describir un elefante".

"Hay que fijarse en el lenguaje corporal. ¿Está temblando, mueve otras partes del cuerpo? ¿Hay mucho movimiento?". El contenido del discurso también cuenta, así como el tono. "Si quieres saber cómo está alguno de tus líderes, fíjate en esos aspectos".

Para los consumidores que se sienten atraídos por las aplicaciones para evaluarse a sí mismos, Ghomi ofrece este consejo: "Piensa en ello como si estuvieras participando en una investigación en este momento".

Gama de investigaciones sobre el análisis de la voz

Entre las áreas en estudio mediante el análisis de la voz:

Riesgo cardíaco: Un algoritmo informático basado en la IA predijo la probabilidad de que una persona tuviera problemas cardíacos relacionados con la obstrucción de las arterias basándose en grabaciones de voz, informaron investigadores de la Clínica Mayo. Los investigadores evaluaron tres grabaciones de voz de 30 segundos de 108 pacientes mediante una aplicación para teléfonos inteligentes. El sistema analizó más de 80 características de las grabaciones de voz.

Luego, los investigadores dieron una puntuación a cada persona. Durante un seguimiento de dos años, los que tenían una puntuación alta tenían 2,6 veces más probabilidades de tener un problema cardíaco y 3 veces más probabilidades de mostrar acumulación de placa en las pruebas médicas que los que tenían una puntuación baja.

Depresión: Otros investigadores, entre los que se encuentra Ghomi, fueron capaces de identificar rasgos de voz recogidos de pacientes con depresión que predecían con exactitud la forma en que un paciente respondería a una sola pregunta de un cuestionario que evalúa si el paciente tiene riesgo de suicidio.

En otro estudio, investigadores coreanos descubrieron que el análisis de la voz puede ayudar a los profesionales de la salud a detectar depresiones menores y mayores. Extrajeron 21 rasgos de voz de grabaciones de entrevistas y los compararon entre tres grupos: 33 participantes no deprimidos, 26 con depresión menor y 34 con depresión mayor. Encontraron siete indicadores de voz que mostraban diferencias entre los tres grupos, incluso después de ajustar aspectos como la edad y el peso corporal.

TEPT: Según otros investigadores, un algoritmo basado en el habla puede ayudar a identificar a los pacientes con trastorno de estrés postraumático. Obtuvieron muestras del habla de veteranos evaluados por sus médicos como afectados por el TEPT o no, y señalaron los rasgos de la voz más probables en los afectados por el TEPT.

Programas de análisis de la voz en el mercado

En 2021, Cigna International, una empresa global de servicios sanitarios, lanzó su test StressWaves para personas y para empresas cuyos miembros tienen un seguro de Cigna. Un usuario habla durante 90 segundos, respondiendo a preguntas, y luego obtiene un análisis de si su nivel de estrés es bajo o alto.

Sonde Health ofrece una aplicación de aptitud mental, basada en investigaciones que demuestran que los cambios de voz están relacionados con los cambios de salud mental, dice Jim Harper, fundador y director de operaciones de la empresa con sede en Boston.

"El objetivo es fomentar el compromiso", dice, y subraya que la intención de la herramienta es promover el bienestar general, y no diagnosticar. La empresa también cuenta con una herramienta de salud respiratoria, después de descubrir que ciertas características de la voz están relacionadas con pacientes con asma y otros problemas pulmonares.

Eleos Health, una startup, ofrece un programa para especialistas en salud mental que, con el consentimiento, graba las sesiones entre médico y paciente y, utilizando la inteligencia artificial de voz, mide los progresos, al tiempo que promete ahorrar tiempo a los médicos.

Ghomi es asesor de Kintsugi, que desarrolla una tecnología de biomarcadores de voz para la depresión y la ansiedad, y forma parte de la oficina de conferenciantes de Biogen.

Hot