AlphaGenome solo podría apoyar la priorización y la interpretación funcional dentro de circuitos, no sustituirlos

Los sesgos genómicos frenan el potencial de Google para prever enfermedades
José Antonio Trujillo, experto en IA y vicepresidente del Colegio de Médicos de Málaga.


SE LEE EN 6 minutos
La Inteligencia Artificial continúa abriéndose camino en el mundo de la Medicina. Si hace unas semanas, la herramienta Delphi-2 demostraba su potencial a la hora de predecir más de 1.000 enfermedades, ahora, un nuevo modelo de última generación, AlphaGenome, lograba derribar una barrera técnica histórica al descifrar el "código regulador" del ADN. En concreto, este sistema de aprendizaje profundo multimodal, desarrollada por Google DeepMind, logra "prever cómo una sola letra del genoma oscuro -entendido como aquellas regiones que no contienen instrucciones para fabricar proteínas- puede causar ciertas patologías". No obstante, este modelo no es ninguna excepción a la hora de prensentar ciertas limitaciones en cuanto a su capacidad de pronóstico. 

De hecho, el estudio de esta herramienta, publicado en la revista Nature, explica que no ha sido evaluado en la predicción de genomas personales, una debilidad mostrada en más de una ocasión en este campo. De ahí que uno de los riesgos principales asociados a su uso sea el sesgo de representatividad, explica, como experto en IA, José Antonio Trujillo. "Un modelo entrenado en referencias (humano/ratón) puede fallar en haplotipos raros, ancestrías infrarrepresentadas, o interacciones entre variantes (epistasis) propias del individuo", detalla.

Este error de base podría traducirse tanto en falsos positivos, al señalar como “fuerte” algo neutro en ese contexto genómico, como en falsos negativos, al "pasar por alto efectos que emergen solo con el 'fondo' genético del paciente". 

Así, aunque este mecanismo permite a los profesionales 'leer' el genoma y predecir "muy bien lo que ya está en el catálogo", el facultativo advierte de una menor sensibilidad respecto a aquellos mecanismos regulatorios "novedosos o poco muestreados", tales como tejidos raros, estados transitorios o contextos patológicos. 

A pesar de su enfoque multimodal, el estudio también indica dificultades para recapitular, con precisión, "patrones finos por tipo celular o condición", por lo que su uso puede verse restringido en enfermedades "donde la epigenética es muy dinámica", como por ejemplo aquellas relacionadas con la inflamación, neurodesarrollo o incluso casos de Oncología bajo tratamiento. En estos casos, "el efecto de una variante puede ser contingente al estado celular, señales del microambiente o a una etapa temporal", por lo que, más allá de orientar una hipótesis, AlphaGenome no contaría con la capacidad suficiente como para "cerrar" una causalidad "sin datos del tejido/estado relevante". 



Modelo "miope" 


Dado que el entrenamiento y la evaluación se centraron predominantemente en genes codificantes de proteínas, también hay posibilidades de que el modelo quede "miope" para mecanismos mediados por RNAs no codificantes, como biogénesis, dianas o redes postranscripcionales, limitando su utilidad "en patologías donde la señal causal está en circuitos regulados por ncRNA, no en cambios clásicos de expresión de genes codificantes". 

Una advertencia parecida es la que se desprende respecto a enfermerdades poligénicas, es decir, aquellas que no están causadas por la mutación de un solo gen, puesto que esta IA predice consecuencias moleculares directas, pero no necesariamente el fenotipo final en rasgos complejos, donde intervienen factores ambientales y procesos biológicos más amplios. Por tanto, el profesional debe leer un score de alta patogenicidad molecular, "como evidencia funcional proximal, no como diagnóstico ni pronóstico", tras integrar el "efecto esperado (dirección/tejido), la carga poligénica, penetrancia, historia familiar, ambiente y consistencia con fenotipo". En cualquier caso, el también vicepresidente del Colegio de Médicos de Málaga recomienda evitar decisiones clínicas basadas solo en ese score. 


Del mismo modo, Trujillo considera que se debería tratar los “efectos fuertes” como priorización, aplicando controles de consistencia en variantes, tejidos y modalidades; de coherencia multimodal; de contraste con evidencias externas, así como una validación funcional escalonada antes de etiquetar clínicamente. La regla práctica, añade, es la de "alto efecto predicho igual a alta prioridad de verificación, no certeza". 


Barreras en su llegada al SNS 


Aunque el modelo "destilado" es eficiente - con menos de 1 segundo en una GPU H100-, el proceso de entrenamiento requirió paralelismo en ocho dispositivos TPU v3 y múltiples fases de preentrenamiento. Esta forma de ajustar "o destilar con datos propios, sí es una barrera relevante", indica, "por lo que la tendencia de muchos hospitales será validar y acotar casos de uso más que recrear el entrenamiento". 

Es más, para el experto, el papel más realista que puede jugar esta herramienta en el contexto actual del Sistema Nacional Sanitario (SNS), es el de "apoyar la priorización y la interpretación funcional dentro de circuitos ya existentes, sin llegar a sustituirlos", a la vista de las limitaciones presentadas. En concreto, Trujllo, menciona barreras en cuanto a validación clínica por indicación, por ejemplo cuando se trate de una enfermedad rara o cáncer y por población, con métricas y umbrales acordados. 

De hecho, antes de ponerlo en marcha en los diferentes ecosistemas sanitarios, ve primordial trazar un flujo de trabajo en función de la capacitación de los profesionales, que establezca "quién lo usa, en qué punto del circuito, y cómo se comunica la incertidumbre al paciente". 


El facultativo también echa en falta protocolos de interpretación en los actuales departamentos de genómica, para saber cómo se integra el score con ACMG/AMP, la evidencia funcional y la segregación familiar, así como aspectos relativos a la trazabilidad y auditoría, como por ejemplo un registro de versión del modelo, reproducibilidad y monitorización de drift. 

En cuanto a los desafíos gestores, señala la necesidad de ejercer una gobernaza sólida que proteja, a nivel legal, los datos genómicos, regule los acuerdos de uso (incluido un uso no comercial), e integre una evaluación de riesgos
Las informaciones publicadas en Redacción Médica contienen afirmaciones, datos y declaraciones procedentes de instituciones oficiales y profesionales sanitarios. No obstante, ante cualquier duda relacionada con su salud, consulte con su especialista sanitario correspondiente.