I asked AI what that means. Came up with a variant pathogenicity analysis and a new hypothesis.
私の息子マイケルは4歳で、耳がよく聞こえません。遺伝子検査によると、STRC遺伝子の2つのコピーが壊れています。1つは病原性と確認されています。もう1つは「意義不明のバリアント(VUS)」です。この分類のせいで、将来の遺伝子治療の臨床試験から除外されてしまいます。
私は遺伝学者ではありません。テクノロジー、クリエイティブ制作、AI教育の仕事をしています。そこで、AIツールを使って自分でバリアントを調査しました。再分類を支持する計算論的エビデンスを見つけ、その位置がすべての哺乳類で保存されていることを確認し、標準的な遺伝学ツールがこの遺伝子では偽遺伝子のために失敗することを発見しました。病院に正式な再分類申請を提出しました。
そして続けました。より短いタンパク質が1つの遺伝子治療ベクターに収まるかどうか分析しました。CRISPRが特定の変異を修正できるかどうか確認しました。STRC遺伝子治療の先駆者である研究者たちに手紙を書きました。励ましの返答を受け取りました。
科学は専門用語の壁に閉じ込められるべきではありません。ポッドキャストと動画が下にあります(どちらもAI生成)。タンパク質構造をスクロールするより聴きたい方のために。
EgorとMichael、香港
NM_153700.2:c.4976A>C p.(Glu1659Ala) の VUS から病原性の可能性が高いへの再分類を支持する計算論的エビデンス
1659番位置でのすべてのアミノ酸置換が「病原性の可能性が高い」と予測されます。この位置は構造的に不変です:いかなる変化もタンパク質を損傷させます。
E1659はテストしたすべての哺乳類で100%保存されており、約8000万年の進化を網羅しています。周囲のモチーフ PEIFTEIGTIAAG はすべての種で同一です。
| 種 | 位置 | 残基 | コンテキスト |
|---|---|---|---|
| ヒト | 1659 | E | PEIFTEIGTIAAG |
| マウス | 1693 | E | PEIFTEIGTIAAG |
| ラット | 1693 | E | PEIFTEIGTIAAG |
| ウシ | 1647 | E | PEIFTEIGTIAAG |
| ミドリザル | 1659 | E | PEIFTEIGTIAAG |
| ブタ | 1650 | E | PEIFTEIGTIAAG |
| イヌ | 1649 | E | PEIFTEIGTIAAG |
| コウモリ | 1646 | E | PEIFTEIGTIAAG |
| クマ | 1643 | E | PEIFTEIGTIAAG |
9/9種すべてでこの位置にグルタミン酸(E)が保存されています。周囲の13残基モチーフ(PEIFTEIGTIAAG)はテストしたすべての哺乳類で同一です。この保存レベルは機能的重要性を強く示唆し、いかなる置換の病原性も支持します(ACMGガイドライン PP1 支持的根拠)。データソース:UniProt相同配列、モチーフベースアライメント。
ステレオシリン(Q7RTU9、1775 aa)AlphaFold v6より。E1659位置をマゼンタでハイライト表示。ドラッグで回転、スクロールでズーム。
色:pLDDT信頼度(青=高、赤=低)
グルタミン酸側鎖をスティックで表示
STRCには第15染色体15q15.3上に隣接する、ほぼ同一の偽遺伝子(STRCP1)があります。このため、ほとんどの標準的な計算ツールがSTRCバリアントに対して失敗するか、信頼性の低い結果を返します:
AlphaMissenseはSTRCに特に価値があります。なぜなら、タンパク質構造から病原性を予測するため、偽遺伝子STRCP1が他のツールを失敗させる配列アライメントステップを回避できるからです。REVEL(0.65)もこの問題を部分的に緩和するアンサンブルアプローチを使用した一致した予測を提供します。
| 基準 | 強度 | 根拠 |
|---|---|---|
| PM3 | 中等度 | 既知の病原性全遺伝子欠失(父方確認)とトランスで検出 |
| PP3_Moderate | 中等度 | AlphaMissense 0.9016 + REVEL 0.65 一致(Pejaver 2022閾値) |
| PM2_Supporting | 補助的 | gnomADに不在(251,000人以上で0アレル) |
| PP1_Supporting | 補助的 | E1659は9哺乳類種で100%保存(約8000万年)。同一モチーフ PEIFTEIGTIAAG。 |
中等度2つ + 補助的2つ = ACMG/AMP 2015の組み合わせ規則に従い「病原性の可能性が高い」
STRC遺伝子治療を加速するための計算論的仮説。実験的検証が必要です。
現在のSTRC遺伝子治療は、遺伝子(5,325 bp)が1つのAAVのパッケージング制限(使用可能約4,400 bp)を超えるため、2つのAAVベクターが必要です。AlphaFold構造解析は、単一ベクターアプローチが可能である可能性を示唆しています。
AlphaFoldはステレオシリンの構造をタンパク質全体にわたって様々な信頼度で予測します。N末端領域(残基1-615)は非常に低い信頼度(pLDDT < 50)を示しており、安定した3D構造を持たない本質的に無秩序な状態である可能性を示しています。機能的コアは残基616付近から始まります。
すべての領域でpLDDT < 50(安定した構造なし)
3984 bpは単一AAVに収まる(< 4400 bp)
このアプローチには実証済みの先例があります。ジストロフィン遺伝子(11,000 bp)はどのAAVにも大きすぎました。研究者は非必須のスペクトリン様リピートを除去して「マイクロジストロフィン」を作成し、単一のAAVに収めました。現在、第3相臨床試験(Sarepta SRP-9001)が進行中です。同じ原則:構造的コアを特定し、無秩序/冗長な領域を除去し、機能を保存する。STRCではまだ誰も試みていません。
重要:これはAlphaFold構造予測に基づく計算論的仮説です。実験的検証が必要です:ミニステレオシリンは正しく折り畳まれるか?不動毛の先端に局在するか?水平トップコネクターと蓋膜付着を形成するか?これらの問いには実験室での検証が必要です。しかし、構造データはN末端領域が非必須であることを強く示唆しており、単一AAVミニSTRCアプローチは調査に値します。
ミニSTRC仮説と変異の影響を系統的に計算論的に検証。3DモデルはAlphaFold 3 CIFファイルからライブレンダリング。ドラッグで回転、スクロールでズーム。
低信頼度相互作用。最良鎖間PAE:N末端8.6 A。
N末端削除は結合にほぼ影響なし(0.43対0.47)。不要と確認。
構造的損傷なし。フォールディングは無傷。E1659Aは機能に影響(電荷喪失)、構造には影響なし。
完全タンパク質。N末端がスコアを下げる(16%無秩序)。
より良い。はるかに良い。タンパク質は清潔で、タイトで、より確実。単一AAVに収まる。
はい。構造的ノイズ。AlphaFold 3は安定した折り畳みを予測できない。除去可能。
N末端なしのミニSTRC:pTM 0.81。全長野生型:pTM 0.63。N末端のみ:pTM 0.27。N末端は余分な重荷。除去するとタンパク質の折り畳みが良くなり、単一AAVベクターに収まる(3546 bp対5325 bp)。
STRC遺伝子全体(5,325 bp)を置換する代わりに、変異した1塩基だけを修正できたらどうでしょうか?3種類の遺伝子編集ツールがあります。マイケルの特定のバリアントについてそれぞれを確認しました。
プライム編集には標的付近に「着陸地点」(PAMサイト、NGG配列)が必要です。Ensembl REST APIからバリアント周辺のゲノム配列をダウンロードし、バリアントから15 bp以内のNGGモチーフを検索しました。
現実確認:プライム編集はまだ内耳有毛細胞においてin vivoでは試験されていません。蝸牛深部の外有毛細胞へのプライム編集器 + ガイドRNAの送達は未解決の課題です。しかし、この解析はマイケルの特定のバリアントが技術的にターゲット可能であることを確認しています。送達が解決されれば(現在活発に研究されている分野)、この変異をDNAレベルで修正できます。
誰でも結果を再現できるよう、ステップごとの方法論
私は科学的なトレーニングを受けていない父親です。テクノロジーとクリエイティブ制作の分野で働いています。同じ状況にある方が再現できるよう、私が実際に行ったことをステップごとに正確にまとめました。
香港小児病院(検査番号:23C7500174、2022年12月)から届いたMichaelの全エクソーム解析(WES)報告書には、2つのSTRC変異が記載されていました。一つは「病原性」と分類されたもの(父親由来の遺伝子全体の欠失、MLPAにより確認)。もう一つは「意義不明の変異体(VUS)」と分類されたもの(母親由来の1塩基置換、サンガーシークエンシングにより確認):NM_153700.2:c.4976A>C p.(Glu1659Ala)。この2番目の変異が実際に有害かどうかを確認する必要がありました。
UniProtで「STRC」を検索し、ステレオシリン(stereocilin)のIDが Q7RTU9 であることを確認しました。次にAlphaFoldにアクセスし、このタンパク質の予測3次元構造を取得しました。位置1659における信頼スコア(pLDDT)は95.69/100であり、この部位の構造予測が非常に高い信頼性を持つことが示されました。
AlphaMissenseはGoogle DeepMindによるツールで、タンパク質の変異が有害かどうかを予測します。ステレオシリンの予測ファイルをダウンロードし、「E1659A」を検索しました(E = グルタミン酸、元のアミノ酸;A = アラニン、Michaelの変異)。
結果:1.0点中0.9016点(病原性の可能性あり)。 0.564を超えると有害と見なされます。次に、位置1659における他の19通りの変異をすべて確認したところ、いずれも0.846以上のスコアを示しました。これは位置1659が構造的に重要であることを意味します:ここに変化が生じるとタンパク質の機能が損なわれます。
| protein_variant | am_pathogenicity | am_class |
| E1659A | 0.9016 | LPath |
| E1659D | 0.9483 | LPath |
| E1659G | 0.9191 | LPath |
| ... 全19置換:LPath(0.846〜0.999) | ||
タンパク質において重要な部位は、異なる生物種間で同じアミノ酸が保存される傾向があります。UniProtから9種の哺乳類(ヒト、マウス、ラット、ウシ、サル、ブタ、イヌ、コウモリ、クマ)のステレオシリン配列をダウンロードし、それぞれの配列で位置1659周辺のモチーフを検索しました。
結果:100%保存。 9種すべてがこの部位にグルタミン酸(E)を持っていました。周辺13残基モチーフ(PEIFTEIGTIAAG)は約8,000万年の進化を経て同一でした。これはACMG基準によるPP1 Supporting evidenceに該当します。
通常、遺伝学者はSIFT、PolyPhen-2、CADDを用いて変異を評価します。Ensembl VEP APIを通じて3つすべてを試みましたが、この変異に対してはいずれも結果が得られませんでした。
その理由:STRCの隣接領域には、ほぼ同一の「対になる」偽遺伝子(STRCP1)が存在し(染色体15番)、配列アライメントに基づくツールを混乱させます。これがAlphaMissenseがSTRCにとって特に重要である理由です:AlphaMissenseはDNA配列ではなくタンパク質の3次元構造から解析するため、偽遺伝子の影響を受けません。
ACMG/AMPガイドライン(Richards et al., 2015)は、遺伝学者が変異を分類する際に使用する標準的な枠組みです。各証拠にはコードと強さのレベルが割り当てられます。私はこのルールを学び、適用しました:
中等度2項目 + 支持的2項目 = 病原性の可能性あり(Likely Pathogenic)。ACMG組み合わせルール(Table 5)に基づき、Likely Pathogenicの閾値を満たします。
すべての証拠をまとめ、香港小児病院の化学病理学検査室宛に正式な書面を作成し、この変異のVUSからLikely Pathogenicへの再分類審査を依頼しました。AlphaMissenseのデータ、保存性解析、ACMGの基準の詳細を添付しました。また、証拠が透明性を持ち、再現可能であり、事例を審査するすべての方に利用できるよう、このウェブサイトを構築しました。
病院が再分類を受け入れた場合、Michaelの分子診断が確定します:両アレル病原性STRC(DFNB16)。これは将来の遺伝子治療臨床試験への参加条件となります。デュアルAAV遺伝子治療は、すでにSTRC欠損マウスでの聴覚回復が実証されています(Iranfar et al., 2026年1月)。ヒト臨床試験は2〜3年以内に開始される見込みです。Michaelは7〜8歳になります。
タンパク質構造の読み解き方を理解したとき、さらに先に進めることに気づきました。私は遺伝学者ではありませんが、これらのツールは存在し、無料で利用でき、息子の未来は誰かが正しい問いを立てることにかかっているかもしれません。だから続けました。
遺伝子全体を置き換えるのではなく、たった1文字の誤りを修正できないでしょうか?EnsemblからMichaelの変異周辺のゲノム配列をダウンロードし、遺伝子編集ツールでその部位を標的にできるかを確認しました。
塩基編集(CBE/ABE):この変異の修正は不可能(C>Aトランスバージョンは対応範囲外)。プライム編集:実行可能。 変異から4塩基離れた場所に適切なPAMサイトを確認しました。プライムエディターによる1塩基変化の理論的な修正は可能と考えられますが、内耳細胞での検証はまだ行われていません。
現在のSTRC遺伝子治療では、遺伝子が長すぎるため2つのウイルス(デュアルAAV)が必要です。2つのウイルスは効率が低下します:両方が同じ細胞に感染する必要があるからです。AlphaFoldの構造を解析したところ、最初の約600アミノ酸の構造信頼性(pLDDT)が50未満と非常に低く、安定した構造を形成しない可能性があり、不要な領域かもしれないと気づきました。
これらの領域を除去すると、残りの「ミニステレオシリン」(1,328 aa、3,984 bp)は1つのAAVベクターに収まります。これは計算上の仮説です。実験室での検証が必要です。ただし先例はあります:マイクロジストロフィン(ジストロフィンの非必須領域を除去)は現在、筋ジストロフィーの第3相臨床試験が進行中です。
ミニSTRCの仮説をさらに検証するため、AlphaFold 3 Serverにジョブを投入し、ステレオシリンと相互作用パートナーのTMEM145の3次元複合体構造を予測しました(TMEM145はステレオシリンの機能に必須と最近発見されたタンパク質;Nature Communications 2025)。
結果が得られました(ジョブ1)。ipTM = 0.47、pTM = 0.48。低信頼度の直接結合。PAEマトリックス解析はN末端残基174-185での最良の鎖間接触を示します(しかしPAEはまだ8.6 Aと不良)。
さらに5つのジョブを投入し、ミニSTRC仮説を系統的に検証しました:
| # | 実験 | 状態 | 検証内容 |
|---|---|---|---|
| 1 | 完整STRC + TMEM145 | 完了(ipTM 0.47) | ベースライン相互作用 |
| 2 | ミニSTRC + TMEM145 | 完了(ipTM 0.43) | N末端不要(0.43対0.47ベースライン) |
| 3 | STRC E1659A突変体(単独) | 完了(pTM 0.64) | 構造的損傷なし(=野生型0.63)。機能的影響のみ。 |
| 4 | STRC野生型(単独) | 完了(pTM 0.63) | ベースライン:16%無秩序(N末端がスコアを下げる) |
| 5 | ミニSTRC単独 | 完了(pTM 0.81) | YES!ミニSTRCは極めて良好に折り畳まれる(7%無秩序) |
| 6 | N末端のみ(1-615) | 完了(pTM 0.27) | 確認済み:38%無秩序、pTM 0.27 |
米国、フランス、中国の研究機関でSTRC遺伝子治療を研究している主要な研究者にメールを送りました。再分類の証拠、ミニSTRCの仮説、そしてこのウェブサイトへのリンクを共有しました。
計算論的アプローチが妥当であることを確認する励ましの返信をいただき、この解析がSTRC遺伝子治療に取り組む研究チームと共有されたとの連絡を受けました。
すべての科学ツールは無料で利用できます。AlphaFold 3 ServerにはGoogleアカウントが必要です。総費用:月額20ドルのClaudeサブスクリプションのみ。その他はすべてオープンアクセスです。