當突觸學會等待:海馬的秒級學習與信貸分配之謎

https://www.biorxiv.org/content/10.1101/2025.02.15.630814v1

在大腦如何進行「credit assignment(信貸分配)」的研究中,一直存在一個關鍵難題:

神經元活動與行為結果之間往往相隔幾秒甚至幾十秒,但突觸可塑性(如 STDP)通常只作用在毫秒級。這使得行為導向的學習機制難以用傳統的突觸規則解釋。Cone、Clopath 與 Costa 在 2025 年提出了這篇極具突破性的工作——他們以實驗上觀察到的 Behavioral Timescale Synaptic Plasticity (BTSP) 為基礎,建立了一個可數學解析的學習框架(generalized BTSP, gBTSP),成功將「秒級可塑性」轉譯成一套可以描述、推導與模擬的理論模型。


作者首先以實驗資料為基礎,提出一個廣義學習規則:

image.png

其中 Pi(t為樹突 plateau 函數、Wkernel為雙指數可塑性核、λWij 為異突觸抑制項。這個公式能精確再現海馬 CA1 實驗中測得的 BTSP 時間窗與學習強度,建立起「行為時間尺度可塑性」的理論基底。

image.png


圖1:gBTSP 核心方程與可塑性 kernel 模擬 vs 實驗曲線

當 gBTSP 用於前饋網路(CA3→CA1 類型)時,若整體活動低於閾值,就隨機觸發一個 plateau。

這種規則自然產生 competitive learning(競爭式學習):每個神經元透過一次 plateau「佔領」一段空間,使整體網路的活動場均勻分佈於環境中。結果顯示,CA1 神經元能一-shot 形成 place field,並隨時間出現代表性漂移(representational drift),完全符合小鼠實驗的觀察。


當同樣的 gBTSP 規則用於具 seed neuron 的迴圈網路(CA3 類型)時,plateau 可快速塑造出一個低秩 recurrent 結構 Wrec=WdWeW_{rec}=W_dW_eWrec=WdWe。這種結構在訓練後自發形成 環形吸引子(ring attractor),可支撐 pattern completion 與 memory replay,顯示 BTSP 具備在內部生成記憶 manifold 的能力。

螢幕擷取畫面 2025-11-01 153054.png

圖2.1:seed–visible 網路結構

image.png

                                                                                                     圖2.2: 2D模擬PC1–PC2 投影呈現環形 manifold