Cas9 Variant Screening · Methodology Note

為什麼「結合自由能漏斗」量錯了東西

Cas9 的動力學問題 —— 給變體篩選 pipeline 的一則方法學提醒

計算化學 × 蛋白工程 · 對照合作者 v5 screening funnel · 2026-07-02
v5 漏斗從頭到尾在排序平衡結合自由能(ΔG_bind / ΔΔG),但 Cas9 的編輯效率與專一性 主要由「動力學」決定,不是由結合強度決定。用 ΔG 排名去挑「更專一 / 更好」的變體,可能系統性地挑錯。

背景一:Cas9 不是「結合 = 切」的開關

它是一台有內建檢查點的多步驟機器。辨識 on-target 與 off-target,主要不在「綁得緊不緊」,而在中間那道構形關卡。

1. PAM 辨識 找到 NGG 2. R-loop 形成 逐鹼基配對 3. 構形檢查點 HNH 翻轉 docking rate-limiting · 對 mismatch 敏感 4. 切割 HNH 到位才切 5. 釋放 週轉 On-target(完全配對) HNH docking → 切 k_cleave 快 Off-target(有 mismatch) HNH 卡住 → 先脫離 k_off 贏過 k_cleave
辨識 on/off-target 主要發生在第 3 步(構形檢查點),而不是第 1–2 步(結合)。

背景二:平衡 ΔG 與 動力學,差在哪

平衡結合 ΔG_bind 漏斗在算這個

蛋白和 DNA「黏得多緊」的熱力學量(∝ K_d)。MM-PBSA、FEP、DeePNAP、PDIScore 全在估這個或它的變化。

動力學 真正決定專一性

各步驟的速率:R-loop 推進、HNH 活化 k_activation、切割 k_cleave、脫離 k_off。專一性 ≈ 在 mismatch 下 k_off 相對 k_cleave 有多大

盲區在這裡 一個變體可以結合 ΔG 幾乎不變,卻把 HNH 活化的能障墊高 → mismatch 目標來得及掉下來、而非被切 → 專一性大增,而 ΔG 完全看不出差別。這就是 ΔG 漏斗漏掉的維度。

決定性證據:高保真變體(不是推測,是實驗釘死的)

SpCas9-HF1、eSpCas9(1.1)、HypaCas9 這些高保真變體的機制研究顯示:

結合 ≈ 相同,切割行為 = 天差地別。 這正是 ΔG 漏斗會漏掉的維度。

名詞:Kinetic proofreading(動力學校對) 系統靠「在做出不可逆動作(切割)前,插入一個會讓錯誤基質優先脫離的慢步驟」來提升精度。 精度藏在速率比,不在結合常數。

誠實校準(別矯枉過正)

ΔG 不是完全沒用:

對 v5 漏斗的含意

  1. Phase 1–4 全部(LigandMPNN score、DeePNAP ΔΔG、PDIScore、MM-PBSA、甚至 FEP)量的都是結合 / 平衡量 → 當粗篩(enrichment)很好,當專一性 ranker 會系統性失準
  2. v5 相對 v3/v4 還拿掉了明確的 off-target/specificity 支線 —— 但專一性偏偏最需要動力學,風險更集中。
  3. 主要驗證端點必須定成「功能 / 動力學 assay」(cleavage rate、editing efficiency),SPR/BLI 這種平衡結合數據只能次要。
    若拿 SPR 去驗證這條 ΔG 漏斗,dashboard 全綠也只是「證明它擅長預測結合」,不等於「擅長預測編輯 / 專一性」。

真正能量到動力學的物理方法(要補的支線)

平衡 FEP / MM-PBSA 算不出速率。要碰到 kinetics 得換工具:

給合作者的建議

  1. 肯定 v5 的工程與工具選擇是對的(LigandMPNN 懂核酸、模組化路徑、清楚 I/O),先把它當便宜的上游結合可行性篩子用起來。
  2. 明講定位:Phase 1–4 = 結合可行性 enrichment,不是專一性 / 功能引擎。
  3. 把主要 validation endpoint 定成 kinetic/功能 assay,並請合作者提供 3–5 個已知功能結果的變體來校準。
  4. 加一條 kinetic 支線:對候選做 HNH 構形活化 / R-loop 的能障或 MSM 分析,和 assay 的速率對關聯 —— 先在 1–2 個變體證明 proxy 相關,再談規模

參考文獻

方法學筆記 · 對照 High-Throughput In Silico Variant Screening Funnel v5 · 計算化學視角