I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.
Mi hijo Michael tiene 4 años y no oye bien. Su prueba genética indica que tiene dos copias rotas del gen STRC. Una está confirmada como patogénica. La otra es una «Variante de significado incierto». Esta clasificación lo excluye de los futuros ensayos clínicos de terapia génica.
No soy genetista. Trabajo en tecnología, producción creativa y educación en IA. Así que utilicé herramientas de IA para investigar la variante yo mismo. Encontré evidencia computacional para la reclasificación, confirmé que la posición está conservada en todos los mamíferos y descubrí que las herramientas genéticas estándar fallan para este gen debido a un pseudogén. Presenté una solicitud formal de reclasificación al hospital.
Luego continué. Analicé si una proteína más corta podría caber en un solo vector de terapia génica. Comprobé si CRISPR podría corregir la mutación específica. Escribí a los investigadores que fueron pioneros en la terapia génica STRC. Recibí respuestas alentadoras.
La ciencia no debería estar encerrada detrás de jerga. Hay un podcast y un video abajo (ambos generados por IA) para quien prefiera escuchar en vez de revisar estructuras proteicas.
Egor y Michael, Hong Kong
Evidencia computacional que respalda la reclasificación de VUS a Probablemente patogénica para NM_153700.2:c.4976A>C p.(Glu1659Ala)
Cada posible sustitución de aminoácidos en la posición 1659 es predicha como Probablemente patogénica. Esta posición es estructuralmente invariante: cualquier cambio rompe la proteína.
E1659 está conservado al 100% en todos los mamíferos probados, abarcando ~80 millones de años de evolución. El motivo circundante PEIFTEIGTIAAG es idéntico en cada especie.
| Especie | Posición | Residuo | Contexto |
|---|---|---|---|
| Humano | 1659 | E | PEIFTEIGTIAAG |
| Ratón | 1693 | E | PEIFTEIGTIAAG |
| Rata | 1693 | E | PEIFTEIGTIAAG |
| Vaca | 1647 | E | PEIFTEIGTIAAG |
| Mono verde | 1659 | E | PEIFTEIGTIAAG |
| Cerdo | 1650 | E | PEIFTEIGTIAAG |
| Perro | 1649 | E | PEIFTEIGTIAAG |
| Murciélago | 1646 | E | PEIFTEIGTIAAG |
| Oso | 1643 | E | PEIFTEIGTIAAG |
9/9 especies conservan el ácido glutámico (E) en esta posición. El motivo de 13 residuos circundante (PEIFTEIGTIAAG) es idéntico en todos los mamíferos probados. Este nivel de conservación sugiere fuertemente importancia funcional y apoya la patogenicidad de cualquier sustitución (evidencia PP1 de apoyo según ACMG). Fuente de datos: secuencias ortólogas de UniProt, alineación basada en motivos.
Estereocilina (Q7RTU9, 1775 aa) de AlphaFold v6. Posición E1659 resaltada en magenta. Arrastra para rotar, desplaza para hacer zoom.
Color: confianza pLDDT (azul=alta, rojo=baja)
Cadena lateral del ácido glutámico mostrada como palillos
STRC tiene un pseudogén casi idéntico (STRCP1) ubicado adyacente en el cromosoma 15q15.3. Esto hace que la mayoría de las herramientas computacionales estándar fallen o devuelvan resultados poco fiables para las variantes STRC:
AlphaMissense es únicamente valioso para STRC porque predice la patogenicidad a partir de la estructura proteica, evitando el paso de alineación de secuencias donde el pseudogén STRCP1 provoca el fallo de otras herramientas. REVEL (0,65) también proporciona una predicción concordante, usando un enfoque de conjunto que mitiga parcialmente este problema.
| Criterio | Fuerza | Evidencia |
|---|---|---|
| PM3 | Moderada | Detectado en trans con deleción patogénica de gen completo (confirmada paterna) |
| PP3_Moderate | Moderada | AlphaMissense 0,9016 + REVEL 0,65 concordantes (umbral Pejaver 2022) |
| PM2_Supporting | Apoyo | Ausente en gnomAD (0 alelos en 251.000+ individuos) |
| PP1_Supporting | Apoyo | E1659 100% conservado en 9 especies mamíferas (~80M años). Motivo idéntico PEIFTEIGTIAAG. |
2 Moderadas + 2 Apoyo = Probablemente patogénica según las reglas de combinación ACMG/AMP 2015
Hipótesis computacionales para acelerar la terapia génica STRC. Requieren validación experimental.
La terapia génica STRC actual requiere dos vectores AAV porque el gen (5.325 pb) supera el límite de empaquetamiento de un solo AAV (~4.400 pb utilizables). El análisis estructural de AlphaFold sugiere que un enfoque de un solo vector podría ser posible.
AlphaFold predice la estructura de la estereocilina con confianza variable a lo largo de la proteína. La región N-terminal (residuos 1-615) tiene muy baja confianza (pLDDT < 50), indicando que probablemente está intrínsecamente desordenada sin estructura 3D estable. El núcleo funcional comienza alrededor del residuo 616.
Todas las regiones tienen pLDDT < 50 (sin estructura estable predicha)
3984 pb cabe en un solo AAV (< 4400 pb)
Este enfoque tiene un precedente demostrado. El gen de la distrofina (11.000 pb) era demasiado grande para cualquier AAV. Los investigadores crearon la «micro-distrofina» eliminando repeticiones espectrina no esenciales, haciéndola caber en un solo AAV. Ahora está en ensayos clínicos de fase 3 (Sarepta SRP-9001). El mismo principio: identificar el núcleo estructural, eliminar regiones desordenadas/redundantes, preservar la función. Nadie ha intentado esto para STRC todavía.
Importante: Esta es una hipótesis computacional basada en predicciones estructurales de AlphaFold. Requiere validación experimental: ¿se pliega correctamente el mini-estereocilina? ¿Se localiza en los extremos de los estereocilios? ¿Forma conectores horizontales superiores y uniones a la membrana tectorial? Estas preguntas requieren trabajo de laboratorio. Pero los datos estructurales sugieren fuertemente que la región N-terminal es prescindible y que un enfoque mini-STRC de vector único merece investigación.
Prueba computacional sistemática de la hipótesis mini-STRC y el impacto de la variante. Modelos 3D renderizados en vivo desde archivos CIF de AlphaFold 3. Arrastra para rotar, desplaza para hacer zoom.
Interacción de baja confianza. Mejor PAE inter-cadena: 8,6 A en N-terminal.
La eliminación N-terminal apenas afecta la unión (0,43 vs 0,47). Confirma prescindible.
Sin daño estructural. El plegamiento está intacto. E1659A afecta la función, no la estructura.
Proteína completa. El N-terminal arrastra la puntuación (16% desordenado).
La proteína truncada se pliega excelentemente. 7% desordenado. Resultado clave.
Confirmado desordenado. 38% no estructurado. Seguro eliminar.
Mini-STRC (sin N-terminal) alcanza pTM 0,81, significativamente mejor que el tipo salvaje completo (pTM 0,63). La región N-terminal eliminada solo puntúa pTM 0,27 con 38% de desorden. Eliminar el N-terminal desordenado produce una proteína que se pliega mejor y cabe en un solo vector AAV.
En lugar de reemplazar el gen STRC completo (5.325 pb), ¿qué pasaría si pudiéramos corregir solo la única base mutada? Hay tres tipos de herramientas de edición génica. Verifiqué cada una contra la variante específica de Michael.
La edición prime requiere un «pad de aterrizaje» (sitio PAM, secuencia NGG) cerca del objetivo. Descargué la secuencia genómica desde Ensembl REST API y busqué motivos NGG dentro de 15 pb de la variante.
Verificación de realidad: La edición prime no ha sido probada en células ciliadas del oído interno in vivo. Entregar el prime editor + ARN guía a las células ciliadas externas en lo profundo de la cóclea es un desafío no resuelto. Pero este análisis confirma que la variante específica de Michael es técnicamente targetable. Si se resuelve la entrega (un área activa de investigación), esta mutación puede corregirse a nivel de ADN.
Metodología paso a paso para que cualquiera pueda reproducir estos resultados
Soy un padre sin formación científica que trabaja en tecnología y producción creativa. Aquí está exactamente lo que hice, paso a paso, para que cualquier persona en la misma situación pueda reproducirlo.
El informe WES de Michael del Hospital Infantil de Hong Kong (Nº de lab: 23C7500174, diciembre 2022) listaba dos variantes STRC. Una estaba etiquetada como «Patogénica» (una deleción de gen completo de su padre, confirmada por MLPA). La otra estaba etiquetada como «Variante de significado incierto» (un cambio de letra de su madre, confirmada por secuenciación Sanger): NM_153700.2:c.4976A>C p.(Glu1659Ala). Necesitaba saber: ¿es realmente dañina esta segunda variante?
Le pedí a Claude que buscara la proteína STRC. Buscó en UniProt y encontró el ID: Q7RTU9. Claude me señaló AlphaFold, que tiene la estructura 3D predicha. La puntuación de confianza (pLDDT) en la posición 1659 era 95,69 sobre 100, lo que significa que la predicción de estructura en ese punto es muy fiable.
AlphaMissense es una herramienta de Google DeepMind que predice si una mutación proteica es dañina. Descargué el archivo de predicciones de AlphaMissense para la estereocilina y busqué «E1659A» (E = Ácido glutámico, el aminoácido original; A = Alanina, la variante de Michael).
El resultado: 0,9016 sobre 1,0 (Probablemente patogénica). Cualquier valor por encima de 0,564 se considera probablemente dañino. Luego verifiqué los otros 19 posibles cambios en la posición 1659. Cada uno puntuó por encima de 0,846. Esto significa que la posición 1659 es estructuralmente crítica: cualquier cambio rompe la proteína.
| protein_variant | am_pathogenicity | am_class |
| E1659A | 0.9016 | LPath |
| E1659D | 0.9483 | LPath |
| E1659G | 0.9191 | LPath |
| ... 19 sustituciones en total: LPath (0,846-0,999) | ||
Si una posición es importante para la proteína, debería ser el mismo aminoácido en diferentes especies. Claude descargó secuencias de estereocilina de 9 mamíferos en UniProt (humano, ratón, rata, vaca, mono, cerdo, perro, murciélago, oso) y buscó el motivo alrededor de la posición 1659 en cada uno.
Resultado: 100% conservada. Las 9 especies tienen Ácido Glutámico (E) en esta posición. El motivo de 13 residuos circundante (PEIFTEIGTIAAG) es idéntico a través de ~80 millones de años de evolución. Esta es evidencia PP1 de Apoyo bajo los criterios ACMG.
Normalmente, los genetistas usan SIFT, PolyPhen-2 y CADD para verificar variantes. Claude lo intentó todo a través de la API Ensembl VEP. Todas devolvieron nada para esta variante.
La razón: STRC tiene un gen «gemelo» casi idéntico junto a él en el cromosoma 15 (un pseudogén llamado STRCP1) que confunde las herramientas basadas en alineación de secuencias. Por eso AlphaMissense es únicamente importante para STRC: funciona desde la estructura 3D de la proteína, no desde la secuencia de ADN, por lo que el pseudogén no le afecta.
Las directrices ACMG/AMP (Richards et al., 2015) son el marco estándar que usan los genetistas para clasificar variantes. Cada pieza de evidencia recibe un código y nivel de fuerza. Aprendí las reglas y las apliqué:
2 Moderadas + 2 Apoyo = Probablemente patogénica. Según las reglas de combinación ACMG (Tabla 5), esto cumple el umbral para la clasificación Probablemente patogénica.
Compilé toda la evidencia en una carta formal dirigida al Laboratorio de Patología Química del Hospital Infantil de Hong Kong, solicitando una revisión de reclasificación de la variante de VUS a Probablemente patogénica. Adjunté los datos de AlphaMissense, el análisis de conservación y el desglose de los criterios ACMG. También construí este sitio web para que la evidencia sea transparente, reproducible y accesible a cualquiera que revise el caso.
Si el hospital acepta la reclasificación, el diagnóstico molecular de Michael será confirmado: STRC patogénico bialélico (DFNB16). Este es un requisito previo para futuros ensayos clínicos de terapia génica. La terapia génica dual-AAV ya ha restaurado la audición en ratones deficientes en STRC (Iranfar et al., enero 2026). Los ensayos humanos se esperan en 2-3 años. Michael tendrá 7-8 años.
Una vez que entendí cómo leer las estructuras proteicas, me di cuenta de que podía ir más lejos. No soy genetista, pero estas herramientas existen, son gratuitas, y el futuro de mi hijo podría depender de que alguien haga las preguntas correctas. Así que continué.
En lugar de reemplazar todo el gen, ¿qué pasaría si pudiéramos corregir solo la letra incorrecta? Descargué la secuencia genómica alrededor de la variante de Michael desde Ensembl y verifiqué si las herramientas de edición génica podían apuntarla.
Edición de base (CBE/ABE): no puede corregir esta variante (la transversión C>A está fuera de su alcance). Edición prime: factible. Encontré un sitio PAM adecuado a solo 4 pares de bases de la mutación. Un prime editor podría teóricamente corregir el cambio de base único, aunque este enfoque no ha sido probado aún en células del oído interno.
La terapia génica actual para STRC requiere dos virus (dual-AAV) porque el gen es demasiado largo para uno solo. Dos virus significa menor eficiencia: ambos deben entrar en la misma célula. Analicé la estructura de AlphaFold y noté que los primeros ~600 aminoácidos tienen muy baja confianza estructural (pLDDT < 50), sugiriendo que pueden no formar una estructura estable y podrían ser prescindibles.
Si se eliminan esas regiones, la «mini-estereocilina» restante (1.328 aa, 3.984 pb) cabe en un solo vector AAV. Es una hipótesis computacional. Necesita pruebas de laboratorio. Pero el precedente existe: la micro-distrofina (eliminando partes no esenciales de la distrofina) está ahora en ensayos clínicos de fase 3 para distrofia muscular.
Para probar más la hipótesis mini-STRC, enviamos un trabajo al Servidor AlphaFold 3 para predecir la estructura 3D de la estereocilina unida a su pareja de interacción TMEM145 (una proteína descubierta recientemente como esencial para la función de la estereocilina, Nature Communications 2025).
Primeros resultados recibidos (Trabajo 1). ipTM = 0,47, pTM = 0,48. Baja confianza en la unión directa. El análisis de la matriz PAE muestra los mejores contactos inter-cadena en los residuos N-terminales 174-185 (pero aún deficientes a 8,6 A).
Luego envié 5 trabajos más para probar sistemáticamente la hipótesis mini-STRC:
| N° | Experimento | Estado | Prueba |
|---|---|---|---|
| 1 | STRC completo + TMEM145 | Completado (ipTM 0,47) | Interacción de referencia |
| 2 | Mini-STRC + TMEM145 | Completado (ipTM 0,43) | N-terminal prescindible (0,43 vs 0,47 referencia) |
| 3 | Mutante STRC E1659A (solo) | En progreso | ¿La mutación de Misha rompe el plegamiento? |
| 4 | STRC tipo salvaje (solo) | Completado (pTM 0,63) | Referencia: 16% desordenado (N-terminal arrastra la puntuación) |
| 5 | Mini-STRC solo | Completado (pTM 0,81) | ¡SÍ! Mini-STRC se pliega excelentemente (7% desordenado) |
| 6 | Solo N-terminal (1-615) | Completado (pTM 0,27) | CONFIRMADO: 38% desordenado, pTM 0,27 |
Envié correos electrónicos a los principales investigadores que trabajan en terapia génica STRC en instituciones de Estados Unidos, Francia y China. Compartí la evidencia de reclasificación, la hipótesis mini-STRC y un enlace a este sitio web.
Recibí respuestas alentadoras que confirman que el enfoque computacional es sólido y que el análisis ha sido compartido con equipos de investigación que trabajan en terapia génica STRC.
Todas las herramientas son gratuitas. AlphaFold 3 Server requiere una cuenta de Google. Todo lo demás no requiere cuentas, claves API ni programación. Costo total: $0.