El gemelo que no sabías que tenías

El medicamento que ha tomado esta mañana ha recorrido un largo camino para llegar del laboratorio a su paquete de pastillas. Primero, hay una extensa investigación en el laboratorio. Luego, las pruebas en animales. Pero antes de que se apruebe el uso de un medicamento, debe probarse en seres humanos, en un proceso caro y complejo conocido como ensayo clínico.

Lo básico

En su forma más sencilla, un ensayo clínico es algo así: Los investigadores reclutan a pacientes que padecen la enfermedad a la que se dirige el fármaco experimental. Los voluntarios se dividen al azar en dos grupos. Un grupo recibe el fármaco experimental; el otro, llamado grupo de control, recibe un placebo (un tratamiento aparentemente idéntico al fármaco que se está probando, pero que no tiene ningún efecto). Si los pacientes que reciben el fármaco activo mejoran más que los que reciben el placebo, eso demuestra que el fármaco es eficaz.

Una de las partes más difíciles de diseñar un ensayo es encontrar suficientes voluntarios que cumplan los criterios exactos del estudio. Es posible que los médicos no conozcan los ensayos que podrían ajustarse a sus pacientes, y que los pacientes dispuestos a inscribirse no tengan las características necesarias para un ensayo determinado. Pero la inteligencia artificial podría facilitar mucho ese trabajo.

Conozca a su gemelo

Los gemelos digitales son modelos informáticos que simulan objetos o sistemas del mundo real. Se comportan prácticamente igual, desde el punto de vista estadístico, que sus homólogos físicos. La NASA utilizó un gemelo digital de la nave espacial Apolo 13 para ayudar a realizar reparaciones después de que un tanque de oxígeno explotara, dejando a los ingenieros en la Tierra luchando para realizar reparaciones a 200.000 millas de distancia.

Con suficientes datos, los científicos pueden crear gemelos digitales de las personas mediante el aprendizaje automático, un tipo de inteligencia artificial en el que los programas aprenden a partir de grandes cantidades de datos en lugar de estar programados específicamente para la tarea en cuestión. Los gemelos digitales de los pacientes de los ensayos clínicos se crean entrenando modelos de aprendizaje automático con datos de pacientes de ensayos clínicos anteriores y de registros de pacientes individuales. El modelo predice cómo evolucionaría la salud del paciente durante el transcurso del ensayo si se le administrara un placebo, creando esencialmente un grupo de control simulado para un paciente concreto.

Así es como funcionaría: Una persona, llamémosla Sally, es asignada al grupo que recibe el fármaco activo. El gemelo digital de Sally (el modelo informático) está en el grupo de control. Predice lo que ocurriría si Sally no recibiera el tratamiento. La diferencia entre la respuesta de Sally al fármaco y la predicción del modelo de la respuesta de Sally si tomara el placebo en su lugar sería una estimación de la eficacia del tratamiento para Sally.

También se crean gemelos digitales para los pacientes del grupo de control. Al comparar las predicciones de lo que les ocurriría a los gemelos digitales que recibieran el placebo con los humanos que realmente lo recibieron, los investigadores pueden detectar cualquier problema en el modelo y hacerlo más preciso.

Sustituir o aumentar los grupos de control con gemelos digitales podría ayudar tanto a los pacientes voluntarios como a los investigadores. La mayoría de las personas que se apuntan a un ensayo lo hacen con la esperanza de recibir un nuevo medicamento que podría ayudarles cuando los fármacos ya aprobados han fracasado. Pero hay un 50% de posibilidades de que se les incluya en el grupo de control y no reciban el tratamiento experimental. La sustitución de los grupos de control por gemelos digitales podría suponer que más personas tuvieran acceso a los medicamentos experimentales.

Lo inesperado

La tecnología puede ser prometedora, pero aún no se ha generalizado su uso, quizá por una buena razón. El doctor Daniel Neill es un experto en aprendizaje automático, incluidas sus aplicaciones en la atención sanitaria, en la Universidad de Nueva York. Señala que los modelos de aprendizaje automático dependen de tener muchos datos, y puede ser difícil obtener datos de alta calidad sobre los individuos. La información sobre aspectos como la dieta y el ejercicio suele ser autodeclarada, y la gente no siempre es sincera. Tienden a sobrestimar la cantidad de ejercicio que hacen y a subestimar la cantidad de comida basura que comen, dice.

También podría ser un problema tener en cuenta los acontecimientos adversos poco frecuentes, añade. "Lo más probable es que sean cosas que no has modelado en tu grupo de control". Por ejemplo, alguien podría tener una reacción negativa inesperada a un medicamento.

Pero la mayor preocupación de Neill es que el modelo predictivo refleje lo que él llama "lo habitual". Digamos que un acontecimiento inesperado importante -algo como la pandemia de COVID-19, por ejemplo- cambia los patrones de comportamiento de todo el mundo y la gente enferma. "Eso es algo que estos modelos de control no tendrían en cuenta", dice. Esos acontecimientos imprevistos, que no se tienen en cuenta en el grupo de control, podrían sesgar el resultado del ensayo.

Eric Topol, fundador y director del Scripps Research Translational Institute y experto en el uso de tecnologías digitales en la atención sanitaria, cree que la idea es estupenda, pero que aún no está lista para el momento de máxima audiencia. "No creo que los ensayos clínicos vayan a cambiar a corto plazo, porque esto requiere múltiples capas de datos más allá de los registros de salud, como la secuencia del genoma, el microbioma intestinal, los datos ambientales, y así sucesivamente". Prevé que se tardará años en poder realizar ensayos a gran escala utilizando la IA, sobre todo para más de una enfermedad. (Topol es también redactor jefe de Medscape, el sitio web hermano del médico).

Reunir suficientes datos de calidad es un reto, dice el doctor Charles Fisher, fundador y director general de Unlearn.AI, una empresa pionera en gemelos digitales para ensayos clínicos. Sin embargo, afirma que abordar este tipo de problemas forma parte de los objetivos a largo plazo de la empresa.

Dos de las preocupaciones más citadas sobre los modelos de aprendizaje automático -la privacidad y el sesgo- ya están contempladas, dice Fisher. "La privacidad es fácil. Sólo trabajamos con datos que ya han sido anonimizados".

En cuanto al sesgo, el problema no está resuelto, pero es irrelevante, al menos para el resultado del ensayo, según Fisher. Un problema bien documentado de las herramientas de aprendizaje automático es que pueden ser entrenadas en conjuntos de datos sesgados, por ejemplo, los que subrepresentan a un grupo concreto. Pero, según Fisher, como los ensayos son aleatorios, los resultados son insensibles al sesgo de los datos. El ensayo mide cómo afecta el fármaco que se está probando a las personas que participan en él, basándose en una comparación con los controles, y ajusta el modelo para que se ajuste más a los controles reales. Así, según Fisher, aunque la elección de los sujetos para el ensayo esté sesgada, y el conjunto de datos original esté sesgado, "somos capaces de diseñar los ensayos de forma que sean insensibles a ese sesgo".

Neill no encuentra esto convincente. Se puede eliminar el sesgo en un ensayo aleatorio en un sentido estricto, ajustando el modelo para estimar correctamente el efecto del tratamiento para la población del estudio, pero sólo se reintroducirán esos sesgos cuando se intente generalizar más allá del estudio. Unlearn.AI "no está comparando individuos tratados con controles", dice Neill. "Compara a los individuos tratados con estimaciones basadas en modelos de lo que habría sido el resultado del individuo si estuviera en el grupo de control. Cualquier error en esos modelos o cualquier acontecimiento que no prevean puede dar lugar a sesgos sistemáticos, es decir, a una sobreestimación o subestimación del efecto del tratamiento."

Pero unlearn.AI sigue adelante. Ya está trabajando con empresas farmacéuticas para diseñar ensayos sobre enfermedades neurológicas, como el Alzheimer, el Parkinson y la esclerosis múltiple. Hay más datos sobre estas enfermedades que sobre muchas otras, así que eran un buen lugar para empezar. Fisher afirma que este método podría aplicarse a todas las enfermedades, lo que reduciría considerablemente el tiempo necesario para comercializar nuevos medicamentos.

Si esta tecnología resulta útil, estos hermanos invisibles podrían beneficiar tanto a los pacientes como a los investigadores.

Hot