為什麼「結合自由能漏斗」量錯了東西

v5 漏斗從頭到尾在排序平衡結合自由能(ΔG_bind / ΔΔG),但 Cas9 的編輯效率與專一性 主要由「動力學」決定,不是由結合強度決定。用 ΔG 排名去挑「更專一 / 更好」的變體,可能系統性地挑錯。

背景一：Cas9 不是「結合 = 切」的開關

它是一台有內建檢查點的多步驟機器。辨識 on-target 與 off-target,主要不在「綁得緊不緊」,而在中間那道構形關卡。

辨識 on/off-target 主要發生在第 3 步(構形檢查點),而不是第 1–2 步(結合)。

蛋白和 DNA「黏得多緊」的熱力學量(∝ K_d)。MM-PBSA、FEP、DeePNAP、PDIScore 全在估這個或它的變化。

各步驟的速率:R-loop 推進、HNH 活化 k_activation、切割 k_cleave、脫離 k_off。專一性 ≈ 在 mismatch 下 k_off 相對 k_cleave 有多大。

盲區在這裡一個變體可以結合 ΔG 幾乎不變,卻把 HNH 活化的能障墊高 → mismatch 目標來得及掉下來、而非被切 → 專一性大增,而 ΔG 完全看不出差別。這就是 ΔG 漏斗漏掉的維度。

SpCas9-HF1、eSpCas9(1.1)、HypaCas9 這些高保真變體的機制研究顯示:

它們對 on-target 與 off-target 的結合親和力和野生型「差不多」 —— 光看結合分不出 on/off-target。
但單分子 FRET(smFRET)顯示:綁到 off-target 時,HNH domain 卡在「催化不活性」構形,切不下去。
HypaCas9 的做法就是提高 HNH 構形活化的門檻(enhanced proofreading),在幾乎不損 on-target 效率下大幅提升準確度。

→ 結合 ≈ 相同,切割行為 = 天差地別。 這正是 ΔG 漏斗會漏掉的維度。

名詞:Kinetic proofreading(動力學校對) 系統靠「在做出不可逆動作(切割)前,插入一個會讓錯誤基質優先脫離的慢步驟」來提升精度。 精度藏在速率比,不在結合常數。

ΔG 不是完全沒用:

Phase 1–4 全部(LigandMPNN score、DeePNAP ΔΔG、PDIScore、MM-PBSA、甚至 FEP)量的都是結合 / 平衡量 → 當粗篩(enrichment)很好,當專一性 ranker 會系統性失準。
v5 相對 v3/v4 還拿掉了明確的 off-target/specificity 支線 —— 但專一性偏偏最需要動力學,風險更集中。
主要驗證端點必須定成「功能 / 動力學 assay」(cleavage rate、editing efficiency),SPR/BLI 這種平衡結合數據只能次要。
若拿 SPR 去驗證這條 ΔG 漏斗,dashboard 全綠也只是「證明它擅長預測結合」,不等於「擅長預測編輯 / 專一性」。

平衡 FEP / MM-PBSA 算不出速率。要碰到 kinetics 得換工具:

沿反應座標的自由能面(能障) —— 對 HNH 構形活化或 R-loop 推進做 enhanced sampling(metadynamics、umbrella、string method),看能障而不只是端點 ΔG。能障 ∝ 速率(Eyring/Kramers)。
Markov State Models(MSM)/ milestoning —— 從大量短軌跡估狀態間的轉換速率。
這些比平衡 FEP 貴也難,但才對得上「k_activation / k_cleave / 專一性」這個 observable。
你現有的 OpenMM + RTX 4090 + 國網 H200 技術上都做得到(OpenMM 生態有 PLUMED/metadynamics、PyEMMA/deeptime 做 MSM)—— 正好落在物理計算的強項。

肯定 v5 的工程與工具選擇是對的(LigandMPNN 懂核酸、模組化路徑、清楚 I/O),先把它當便宜的上游結合可行性篩子用起來。
明講定位:Phase 1–4 = 結合可行性 enrichment,不是專一性 / 功能引擎。
把主要 validation endpoint 定成 kinetic/功能 assay,並請合作者提供 3–5 個已知功能結果的變體來校準。
加一條 kinetic 支線:對候選做 HNH 構形活化 / R-loop 的能障或 MSM 分析,和 assay 的速率對關聯 —— 先在 1–2 個變體證明 proxy 相關,再談規模。

Chen J.S. et al. Enhanced proofreading governs CRISPR–Cas9 targeting accuracy. Nature 550, 407–410 (2017). —— HypaCas9、HNH 構形檢查點、提高活化門檻提升準確度。
Dagdas Y.S. et al. A conformational checkpoint between DNA binding and cleavage by CRISPR-Cas9. Sci. Adv. 3, eaao0027 (2017). —— REC lobe 感測 / 調控 / 鎖定 HNH。
R-loop formation and conformational activation mechanisms of Cas9. Nature (2022).
Sternberg S.H. et al. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507 (2014). —— PAM-driven 逐鹼基 interrogation。
高保真變體:Kleinstiver et al. 2016(SpCas9-HF1);Slaymaker et al. 2016(eSpCas9(1.1))—— on/off-target 結合 ≈ WT,靠構形檢查點辨識。

方法學筆記 · 對照 High-Throughput In Silico Variant Screening Funnel v5 · 計算化學視角