I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.
Михаилу 4 года. Он плохо слышит. Две повреждённые копии гена STRC. Одна подтверждённо патогенная. Другая: «Вариант неопределённой значимости». Три слова, которые закрывают ему путь к клиническим испытаниям генной терапии.
Я не генетик. Я делаю сайты, снимаю видео и занимаюсь AI-образованием. У меня есть AI-агент (OpenClaw, на базе Claude Opus 4.6), запущенный на моём ноутбуке. Он ищет базы данных, скачивает структуры белков, проводит анализ. Я задаю вопросы с телефона, пока Михаил играет рядом.
Один вопрос привёл к доказательствам для реклассификации. Затем — анализ консервативности. Затем — гипотеза о том, как уместить ген в один терапевтический вектор. Затем шесть структурных экспериментов. Затем три письма учёным, которые стояли у истоков этих исследований. Один ответил на следующую ночь.
Наука не должна быть закрыта за научным жаргоном. Ниже есть подкаст и видео (оба сгенерированы AI) — для тех, кто предпочитает слушать, а не листать структуры белков.
Егор и Михаил, Гонконг
Вычислительные доказательства в поддержку реклассификации NM_153700.2:c.4976A>C p.(Glu1659Ala) из VUS в «Вероятно патогенный»
Каждая возможная замена аминокислоты в позиции 1659 предсказывается как вероятно патогенная. Эта позиция структурно инвариантна: любое изменение нарушает функцию белка.
E1659 на 100% консервативен у всех протестированных млекопитающих, охватывающих ~80 миллионов лет эволюции. Окружающий мотив PEIFTEIGTIAAG идентичен у каждого вида.
| Вид | Позиция | Остаток | Контекст |
|---|---|---|---|
| Человек | 1659 | E | PEIFTEIGTIAAG |
| Мышь | 1693 | E | PEIFTEIGTIAAG |
| Крыса | 1693 | E | PEIFTEIGTIAAG |
| Корова | 1647 | E | PEIFTEIGTIAAG |
| Зелёная мартышка | 1659 | E | PEIFTEIGTIAAG |
| Свинья | 1650 | E | PEIFTEIGTIAAG |
| Собака | 1649 | E | PEIFTEIGTIAAG |
| Летучая мышь | 1646 | E | PEIFTEIGTIAAG |
| Медведь | 1643 | E | PEIFTEIGTIAAG |
9/9 видов сохраняют глутаминовую кислоту (E) в этой позиции. Окружающий 13-остатковый мотив идентичен у всех протестированных млекопитающих. Такой уровень консервативности убедительно свидетельствует о функциональной значимости и поддерживает патогенность любой замены (доказательство PP1 Supporting по критериям ACMG). Источник данных: ортологичные последовательности UniProt, выравнивание на основе мотива.
Стереоцилин (Q7RTU9, 1775 а.к.) из AlphaFold v6. Позиция E1659 выделена пурпурным. Перетащите для вращения, прокрутите для масштабирования.
Цвет: достоверность pLDDT (синий=высокая, красный=низкая)
Боковая цепь глутаминовой кислоты показана в виде палочек
STRC имеет практически идентичный псевдоген (STRCP1), расположенный рядом на хромосоме 15q15.3. Это приводит к тому, что большинство стандартных вычислительных инструментов не справляются с анализом вариантов STRC или возвращают ненадёжные результаты:
AlphaMissense особенно ценен для STRC, поскольку предсказывает патогенность на основе 3D-структуры белка, обходя этап выравнивания последовательностей, где псевдоген STRCP1 приводит к сбоям других инструментов. REVEL (0.65) также даёт согласующееся предсказание, используя ансамблевый подход, частично нивелирующий эту проблему.
| Критерий | Сила | Доказательство |
|---|---|---|
| PM3 | Умеренное | Выявлен в транс с патогенной делецией целого гена (подтверждённой по отцовской линии) |
| PP3_Moderate | Умеренное | AlphaMissense 0.9016 + REVEL 0.65 — конкордантные результаты (порог Pejaver 2022) |
| PM2_Supporting | Поддерживающее | Отсутствует в gnomAD (0 аллелей у 251 000+ индивидуумов) |
| PP1_Supporting | Поддерживающее | E1659 на 100% консервативен у 9 видов млекопитающих (~80 млн лет). Идентичный мотив PEIFTEIGTIAAG. |
2 умеренных + 2 поддерживающих = Вероятно патогенный по правилам комбинирования ACMG/AMP 2015
Вычислительные гипотезы для ускорения генной терапии STRC, требующие экспериментальной проверки.
Текущая генная терапия STRC требует двух AAV-векторов, поскольку ген (5325 пн) превышает лимит упаковки одного AAV (~4400 пн полезной нагрузки). Структурный анализ AlphaFold предполагает возможность однов-ектородного подхода.
AlphaFold предсказывает структуру стереоцилина с различной достоверностью вдоль белка. N-концевая область (остатки 1–615) имеет очень низкую достоверность (pLDDT < 50), что указывает на внутреннюю неупорядоченность без стабильной 3D-структуры. Функциональное ядро начинается примерно с остатка 616.
Все области имеют pLDDT < 50 (стабильная структура не предсказана)
3984 пн помещаются в один AAV (<4400 пн лимит)
У этого подхода есть подтверждённый прецедент. Ген дистрофина (11 000 пн) был слишком велик для любого AAV. Учёные создали «микро-дистрофин», удалив несущественные спектрин-подобные повторы, что позволило уместить его в один AAV. Сейчас это находится в клинических испытаниях Фазы 3 (Sarepta SRP-9001). Тот же принцип: определить структурное ядро, удалить неупорядоченные/избыточные области, сохранить функцию. Никто ещё не применял это к STRC.
Важно: Это вычислительная гипотеза, основанная на структурных предсказаниях AlphaFold. Она требует экспериментальной проверки: правильно ли сворачивается мини-стереоцилин? Локализуется ли он на кончиках стереоцилий? Образует ли горизонтальные верхние коннекторы и прикрепления к текториальной мембране? Эти вопросы требуют лабораторных исследований. Однако структурные данные убедительно свидетельствуют о том, что N-концевая область является несущественной, и однов-ектородный мини-STRC подход заслуживает изучения.
Систематическое вычислительное тестирование гипотезы мини-STRC и влияния варианта. 3D-модели визуализируются в реальном времени из файлов CIF AlphaFold 3. Перетащите для вращения, прокрутите для масштабирования.
Слабо достоверное взаимодействие. Наилучший межцепочечный PAE: 8.6 A на N-конце.
Удаление N-конца почти не влияет на связывание (0.43 против 0.47). Подтверждает несущественность.
Структурных повреждений нет. Фолд сохранён. E1659A влияет на функцию (потеря заряда), а не на структуру.
Полный белок. N-конец снижает оценку (16% неупорядоченных).
Укороченный белок сворачивается превосходно. 7% неупорядоченных. Ключевой результат.
Подтверждена неупорядоченность. 38% неструктурированных. Безопасно удалять.
Мини-STRC (без N-концевой области) достигает pTM 0.81, значительно лучше, чем полноразмерный дикий тип (pTM 0.63). Удалённая N-концевая область набирает лишь pTM 0.27 при 38% неупорядоченности. Удаление неупорядоченного N-конца даёт лучше сворачивающийся белок, помещающийся в один AAV-вектор.
Вместо замены всего гена STRC (5325 пн), что если можно исправить только одно мутировавшее основание? Существуют три типа инструментов редактирования генома. Я проверил каждый применительно к конкретному варианту Михаила.
Прайм-редактирование требует «посадочной площадки» (PAM-сайт, последовательность NGG) вблизи мишени. Я загрузил геномную последовательность через Ensembl REST API и нашёл мотивы NGG в пределах 15 пн от варианта.
Проверка реальностью: Прайм-редактирование не было протестировано на волосковых клетках внутреннего уха in vivo. Доставка прайм-редактора и направляющей РНК во внешние волосковые клетки глубоко в улитке — нерешённая задача. Однако данный анализ подтверждает, что конкретный вариант Михаила технически является мишенью. Если проблема доставки будет решена (активная область исследований), эту мутацию можно исправить на уровне ДНК.
Пошаговая методология, позволяющая воспроизвести эти результаты
Без диплома генетика. Без доступа к лаборатории. Без бюджета. Только ноутбук, телефон и AI-агент (OpenClaw + Claude Opus 4.6), который реально умеет делать вещи: скачивать файлы, искать базы данных, анализировать данные, создавать сайты. Моя работа — задавать правильные вопросы. Вот именно что я спрашивал и что получал в ответ.
Отчёт WES Михаила из Детской больницы Гонконга (Лаб. №: 23C7500174, декабрь 2022) содержал два варианта STRC. Один был помечен как «Патогенный» (делеция целого гена от отца, подтверждённая MLPA). Другой был помечен как «Вариант неопределённой значимости» (замена одной буквы от матери, подтверждённая секвенированием по Сэнгеру): NM_153700.2:c.4976A>C p.(Glu1659Ala). Мне нужно было выяснить: действительно ли второй вариант вреден?
Я попросил Claude найти белок STRC. Он обратился к UniProt и нашёл идентификатор: Q7RTU9. Claude затем указал мне на AlphaFold, где есть предсказанная 3D-структура. Оценка достоверности (pLDDT) в позиции 1659 составила 95.69 из 100, что означает очень высокую надёжность предсказания структуры в этом месте.
AlphaMissense — инструмент Google DeepMind, который предсказывает, является ли мутация белка вредной. Claude загрузил файл предсказаний AlphaMissense для стереоцилина и нашёл «E1659A» (E = глутаминовая кислота, исходная аминокислота; A = аланин, вариант Михаила).
Результат: 0.9016 из 1.0 (Вероятно патогенный). Всё, что выше 0.564, считается вероятно вредным. Затем я проверил все 19 других возможных замен в позиции 1659. Каждая набрала выше 0.846. Это означает, что позиция 1659 структурно критична: любое изменение там нарушает функцию белка.
| protein_variant | am_pathogenicity | am_class |
| E1659A | 0.9016 | LPath |
| E1659D | 0.9483 | LPath |
| E1659G | 0.9191 | LPath |
| ... все 19 замен: LPath (0.846–0.999) | ||
Если позиция важна для белка, аминокислота в ней должна быть одинаковой у разных видов. Claude извлёк последовательности стереоцилина у 9 млекопитающих из UniProt (человек, мышь, крыса, корова, обезьяна, свинья, собака, летучая мышь, медведь) и нашёл мотив вокруг позиции 1659 у каждого.
Результат: 100% консервативности. Все 9 видов имеют глутаминовую кислоту (E) в этой позиции. Окружающий 13-остатковый мотив (PEIFTEIGTIAAG) идентичен на протяжении ~80 миллионов лет эволюции. Это доказательство PP1 Supporting по критериям ACMG.
Обычно генетики используют SIFT, PolyPhen-2 и CADD для проверки вариантов. Claude попробовал все три через Ensembl VEP API. Все они не вернули ничего для этого варианта.
Причина: STRC имеет почти идентичный «ген-двойник» рядом с ним на хромосоме 15 (псевдоген STRCP1), который сбивает с толку инструменты, основанные на выравнивании последовательностей. Именно поэтому AlphaMissense особенно важен для STRC: он работает с 3D-структурой белка, а не с последовательностью ДНК, поэтому псевдоген не влияет на него.
Руководства ACMG/AMP (Richards et al., 2015) — стандартная система, используемая генетиками для классификации вариантов. Каждое доказательство получает код и уровень силы. Я изучил правила и применил их:
2 умеренных + 2 поддерживающих = Вероятно патогенный. Согласно правилам комбинирования ACMG (Таблица 5), это соответствует порогу классификации «Вероятно патогенный».
Я собрал все доказательства в официальное письмо в Лабораторию химической патологии Детской больницы Гонконга с просьбой о пересмотре реклассификации варианта с VUS на Вероятно патогенный. Я приложил данные AlphaMissense, анализ консервативности и разбор критериев ACMG. Кроме того, я создал этот сайт, чтобы доказательства были прозрачными, воспроизводимыми и доступными всем, кто изучает это дело.
Если больница примет реклассификацию, молекулярный диагноз Михаила будет подтверждён: биаллельный патогенный STRC (DFNB16). Это является предпосылкой для участия в будущих клинических испытаниях генной терапии. Двойной AAV-вирусная генная терапия уже восстановила слух у мышей с дефицитом STRC (Iranfar et al., январь 2026). Клинические испытания на людях ожидаются через 2–3 года. Михаилу будет 7–8 лет.
Реклассификация — непосредственная цель. Но когда начинаешь задавать вопросы, остановиться невозможно. Можно ли сделать ген меньше? Исправить только одну букву? А что если проверить это вычислительно, прежде чем кто-то потратит хоть доллар на лабораторию? Это не гениальные озарения. Это очевидные вопросы. Разница в том, что есть AI-агент, который реально может пойти и найти ответы.
Вместо замены всего гена, что если исправить только одну неправильную букву? Claude загрузил геномную последовательность вокруг варианта Михаила из Ensembl и проверил, могут ли инструменты редактирования генома стать мишенью.
Базовое редактирование (CBE/ABE): не может исправить этот вариант (трансверсия C>A выходит за их пределы). Прайм-редактирование: осуществимо. Claude нашёл подходящий PAM-сайт всего в 4 парах оснований от мутации. Прайм-редактор теоретически мог бы исправить замену одного основания, хотя этот подход ещё не тестировался на клетках внутреннего уха.
Текущая генная терапия STRC требует двух вирусов (двойной AAV), поскольку ген слишком длинный для одного. Два вируса означают меньшую эффективность: оба должны попасть в одну клетку. Claude проанализировал структуру AlphaFold и определил, что первые ~600 аминокислот имеют очень низкую структурную достоверность (pLDDT ниже 50), что предполагает отсутствие у них стабильной структуры и их потенциальную несущественность.
Если эти области удалить, оставшийся «мини-стереоцилин» (1328 а.к., 3984 пн) помещается в один AAV-вектор. Это вычислительная гипотеза. Она требует лабораторной проверки. Но прецедент существует: микро-дистрофин (удаление несущественных частей дистрофина) сейчас проходит клинические испытания Фазы 3 при мышечной дистрофии.
Чтобы дополнительно проверить идею мини-STRC, мы направили задание на Сервер AlphaFold 3 для предсказания 3D-структуры стереоцилина в комплексе с его партнёром TMEM145 (белком, недавно открытым как необходимый для функции стереоцилина, Nature Communications 2025).
Получены первые результаты (Задание 1). ipTM = 0.47, pTM = 0.48. Низкая достоверность прямого связывания. Анализ матрицы PAE показывает наилучшие межцепочечные контакты на N-концевых остатках 174–185 (но по-прежнему слабые — 8.6 A).
Затем я направил ещё 5 заданий для систематической проверки гипотезы мини-STRC:
| № | Эксперимент | Статус | Тестирует |
|---|---|---|---|
| 1 | Полный STRC + TMEM145 | Готово (ipTM 0.47) | Базовое взаимодействие |
| 2 | Мини-STRC + TMEM145 | Готово (ipTM 0.43) | N-конец несущественен (0.43 против базового 0.47) |
| 3 | Мутант STRC E1659A (соло) | В процессе | Нарушает ли мутация Михаила укладку белка? |
| 4 | Дикий тип STRC (соло) | Готово (pTM 0.63) | Базовый уровень: 16% неупорядоченных (N-конец снижает результат) |
| 5 | Мини-STRC соло | Готово (pTM 0.81) | ДА! Мини-STRC сворачивается превосходно (7% неупорядоченных) |
| 6 | N-конец соло (1–615) | Готово (pTM 0.27) | ПОДТВЕРЖДЕНО: 38% неупорядоченных, pTM 0.27 |
Я написал письма ведущим исследователям, работающим над генной терапией STRC в учреждениях США, Франции и Китая. Я поделился доказательствами реклассификации, гипотезой мини-STRC и ссылкой на этот сайт.
Я получил обнадёживающие ответы, подтверждающие обоснованность вычислительного подхода и то, что анализ был передан исследовательским группам, работающим над генной терапией STRC.
OpenClaw — опенсорс (бесплатно). Claude Opus 4.6 доступен через Anthropic API (оплата по использованию). Все научные базы данных бесплатны и в открытом доступе. Для сервера AlphaFold 3 требуется аккаунт Google.