v5 漏斗從頭到尾在排序平衡結合自由能(ΔG_bind / ΔΔG),但 Cas9 的編輯效率與專一性
主要由「動力學」決定,不是由結合強度決定。用 ΔG 排名去挑「更專一 / 更好」的變體,可能系統性地挑錯。
背景一:Cas9 不是「結合 = 切」的開關
它是一台有內建檢查點的多步驟機器。辨識 on-target 與 off-target,主要不在「綁得緊不緊」,而在中間那道構形關卡。
辨識 on/off-target 主要發生在第 3 步(構形檢查點),而不是第 1–2 步(結合)。
背景二:平衡 ΔG 與 動力學,差在哪
平衡結合 ΔG_bind 漏斗在算這個
蛋白和 DNA「黏得多緊」的熱力學量(∝ K_d)。MM-PBSA、FEP、DeePNAP、PDIScore 全在估這個或它的變化。
動力學 真正決定專一性
各步驟的速率:R-loop 推進、HNH 活化 k_activation、切割 k_cleave、脫離 k_off。專一性 ≈ 在 mismatch 下 k_off 相對 k_cleave 有多大。
盲區在這裡
一個變體可以結合 ΔG 幾乎不變,卻把 HNH 活化的能障墊高 → mismatch 目標來得及掉下來、而非被切 →
專一性大增,而 ΔG 完全看不出差別。這就是 ΔG 漏斗漏掉的維度。
決定性證據:高保真變體(不是推測,是實驗釘死的)
SpCas9-HF1、eSpCas9(1.1)、HypaCas9 這些高保真變體的機制研究顯示:
- 它們對 on-target 與 off-target 的結合親和力和野生型「差不多」 —— 光看結合分不出 on/off-target。
- 但單分子 FRET(smFRET)顯示:綁到 off-target 時,HNH domain 卡在「催化不活性」構形,切不下去。
- HypaCas9 的做法就是提高 HNH 構形活化的門檻(enhanced proofreading),在幾乎不損 on-target 效率下大幅提升準確度。
→ 結合 ≈ 相同,切割行為 = 天差地別。 這正是 ΔG 漏斗會漏掉的維度。
名詞:Kinetic proofreading(動力學校對)
系統靠「在做出不可逆動作(切割)前,插入一個會讓錯誤基質優先脫離的慢步驟」來提升精度。
精度藏在速率比,不在結合常數。
誠實校準(別矯枉過正)
ΔG
不是完全沒用:
- 有些 HF 變體確實靠削弱非專一 DNA/磷酸骨架接觸(把接觸殘基突成 Ala)來降低整體結合 —— 結合能有參與。
- 過度太緊的結合反而可能拖慢產物釋放、降低週轉 —— 所以「ΔG 越負越好」本身就不對。
- 正確定位:ΔG_bind 是「結合可行性」的必要但不充分初篩。能刷掉「根本綁不上」的爛變體,但不能用來精排「誰更專一 / 誰編輯效率更高」。
對 v5 漏斗的含意
- Phase 1–4 全部(LigandMPNN score、DeePNAP ΔΔG、PDIScore、MM-PBSA、甚至 FEP)量的都是結合 / 平衡量 → 當粗篩(enrichment)很好,當專一性 ranker 會系統性失準。
- v5 相對 v3/v4 還拿掉了明確的 off-target/specificity 支線 —— 但專一性偏偏最需要動力學,風險更集中。
- 主要驗證端點必須定成「功能 / 動力學 assay」(cleavage rate、editing efficiency),SPR/BLI 這種平衡結合數據只能次要。
若拿 SPR 去驗證這條 ΔG 漏斗,dashboard 全綠也只是「證明它擅長預測結合」,不等於「擅長預測編輯 / 專一性」。
真正能量到動力學的物理方法(要補的支線)
平衡 FEP / MM-PBSA 算不出速率。要碰到 kinetics 得換工具:
- 沿反應座標的自由能面(能障) —— 對 HNH 構形活化或 R-loop 推進做 enhanced sampling(metadynamics、umbrella、string method),看能障而不只是端點 ΔG。能障 ∝ 速率(Eyring/Kramers)。
- Markov State Models(MSM)/ milestoning —— 從大量短軌跡估狀態間的轉換速率。
- 這些比平衡 FEP 貴也難,但才對得上「k_activation / k_cleave / 專一性」這個 observable。
- 你現有的 OpenMM + RTX 4090 + 國網 H200 技術上都做得到(OpenMM 生態有 PLUMED/metadynamics、PyEMMA/deeptime 做 MSM)—— 正好落在物理計算的強項。
給合作者的建議
- 肯定 v5 的工程與工具選擇是對的(LigandMPNN 懂核酸、模組化路徑、清楚 I/O),先把它當便宜的上游結合可行性篩子用起來。
- 明講定位:Phase 1–4 = 結合可行性 enrichment,不是專一性 / 功能引擎。
- 把主要 validation endpoint 定成 kinetic/功能 assay,並請合作者提供 3–5 個已知功能結果的變體來校準。
- 加一條 kinetic 支線:對候選做 HNH 構形活化 / R-loop 的能障或 MSM 分析,和 assay 的速率對關聯 —— 先在 1–2 個變體證明 proxy 相關,再談規模。
參考文獻
方法學筆記 · 對照 High-Throughput In Silico Variant Screening Funnel v5 · 計算化學視角