新進研究人員如何理解 2026 年開創性學術領域及 2026 年驗證成果的關鍵轉折

Published on: | Last updated:

2025 年 OSF 上那篇 《Quantifying Emotional States Using Neurochemical Indices》,直接把 dopamine、serotonin、oxytocin、cortisol 四件套拿來當情緒指標,還組了一個叫 Emotional Potency Quotient(EPQ) 的合成指數。這件事本身就很猛:它等於在學術上把「用內分泌/神經化學做 AI 內在狀態控制」從腦洞,推進到一個可被討論的框架。

McEwen(2007)談壓力生理、Sutton & Barto(2018)談外部獎勵的 RL、Panksepp(1998)談情緒神經科學——把這些拼起來,你會看到一條路:外部 reward 不夠,AI 需要一個可自我調節的「數位恆定(digital homeostasis)」內部回饋迴路

  • 核心差異:外部 reward(強化學習) vs. 內部狀態(合成荷爾蒙回饋)
  • 共同關鍵字:dopamine / serotonin / oxytocin / cortisol
  • 2025 的新招:把四者互動量化成 EPQ,試著做「情緒強度與正負向」的指標化
  • 2024 的主軸:用合成荷爾蒙做動機與恆定,讓系統自己管自己
  • 落地焦點:不只軟體,還扯到 bioinspired hardware 與即時回饋
圖 1(Flowchart):把「外部獎勵 AI」走到「內在狀態 AI」的路徑畫清楚
圖 1(Flowchart):把「外部獎勵 AI」走到「內在狀態 AI」的路徑畫清楚

先把話講死:這整套在吵什麼?

Endocrine-Inspired AI 的核心是用 合成荷爾蒙回饋(synthetic hormonal feedback)去模擬 內在動機自我恆定(homeostasis),讓 AI 的行為不只追外部 reward,而是同時維持自己的內部狀態平衡,像生物那樣被「需要」推著走。

我自己讀到這裡的感覺是:它不是要把 AI 變成會哭會笑的東西啦(先別急著怕),而是把「控制系統」的那條線往內縮,縮到一個比較像生理調節的層。

很冷靜地看,這就是在說:RL 那套外部獎勵很會解題,但它不太會處理「我現在其實很累、很焦慮、或我需要社交」這種內在驅動。

嗯。就差這一口氣。

2024 那套:合成荷爾蒙不是裝飾,是控制迴路

2024 的框架把 dopamine(動機)serotonin(情緒/心境調節)oxytocin(社會連結)cortisol(壓力反應)做成「數位版」變數,讓它們在系統裡形成 即時回饋迴路,用來調行為與目標權重。

講到這個詞 dopamine,我腦袋會自動跳到「大家把它當快樂荷爾蒙」那種網路梗,但這裡比較像是:你把它當成 drive / salience 的旋鈕,旋鈕轉大,探索、追求、衝刺就更容易發生;轉小,系統就更像「算了先不要」。

然後 cortisol。壓力那個。這個在控制系統裡其實很好用,因為你總要有一個變數去代表「現在風險上升」或「資源快不夠」。

短句:會痛。

而 2024 文裡還有一個點滿關鍵:不只軟體模型,還談到 bioinspired hardware setup,也就是把回饋迴路放到一個能即時反應的硬體/系統架構裡,讓它不只是紙上談兵。

圖 2(Infocard):四種「合成荷爾蒙」在框架裡各自扮演什麼角色
圖 2(Infocard):四種「合成荷爾蒙」在框架裡各自扮演什麼角色

2025 那篇:EPQ 把「情緒」硬是做成一個可算的指數

2025 的理論模型主張用 dopamine、serotonin、oxytocin、cortisol 的互動去量化情緒,並提出 Emotional Potency Quotient(EPQ) 來評估 情緒正負向(valence)強度(intensity)

老實說,這步很像把「人類情緒很複雜」那句廢話先丟一邊,直接說:好,那我先用四個可解釋的軸,做一個 composite index,讓它至少可以被比較、被校準、被討論。

你說粗糙嗎?可能。你說有沒有用?也可能有用。尤其在 AI-human interaction 那種情境,總得有個東西能讓系統在不同狀態間切換,不然永遠只會輸出「我理解你的感受」。

那句話我聽到會皺眉。真的。

把情緒變成指數不是在「簡化人」,而是在讓模型能被驗證:可計算、可比較、可被反駁。

兩篇的交集到底代表什麼:不是抄不抄,是「收斂」

當兩個獨立脈絡都選到同一組神經化學指標(dopamine、serotonin、oxytocin、cortisol),這比較像研究上的 convergent validity:大家在摸同一頭大象,最後摸到的骨架差不多。

我知道有人會立刻跳去「優先權」或「誰先講」那套,但從比較冷的角度看,真正有價值的是:這組四件套可能剛好是「足夠簡單又足夠有解釋力」的最小集合之一

而且它把 affective computing 跟更偏控制論/系統工程的那條路黏在一起。講到「控制」,我會想到飛機 autopilot:你不會只靠一個外部加分機制讓飛機飛穩,你需要一堆內部狀態回授。嗯,差不多那個味道。

圖 3(Multi-view Diagram):同一套四指標,兩種用法(控制迴路 vs. 情緒量化)
圖 3(Multi-view Diagram):同一套四指標,兩種用法(控制迴路 vs. 情緒量化)

風險矩陣:這套東西哪裡容易翻車(risk_matrix)

把話講白:用神經化學當 AI 的內部變數很酷,但也很容易被誤解、被過度詮釋,或被拿去做奇怪的產品包裝。

下面這張表我寫得有點直接,因為這類框架最常死在「大家太興奮」。

risk_matrix:Endocrine-Inspired AI / EPQ 類框架的主要風險與緩解方向
風險 發生機率 影響程度 常見症狀 我看過比較能收斂的作法(經驗口吻)
把「dopamine=快樂」這種簡化直接搬進模型 模型行為像在追糖,不像在調節動機 把 dopamine 當成 drive / salience 的控制量,然後用行為結果去反推參數,不要用網路科普當定義。
指標可算,但不可驗證(EPQ 變成漂亮數字) 不同實驗條件下 EPQ 漂移,解釋力不穩 我那時候會先把 EPQ 拆回四個分量,做 sensitivity analysis;先證明「哪個量在驅動結果」。
把情緒量化拿去做過度推論(尤其人機互動) 產品說「讀懂你的心」,但其實只是分類器 把輸出措辭降級:講「狀態估計」不要講「理解你」。這個差很多。
硬體/即時回饋做不到,最後只剩論文圖 模擬可以跑,真實環境延遲爆炸 先把回饋頻率、延遲、噪聲當成一等公民寫進規格;做不到就承認做不到,別硬吹。
倫理與濫用:情緒指標被用來操控使用者 低到中 互動設計朝成癮、黏著走 我看過比較像樣的是把限制寫進系統:例如輸出節流、透明化、可關閉;並且做內部審查流程。

If This Then That:不同族群怎麼看這套框架(分眾決策)

如果你把這類研究拿去讀、拿去做產品、拿去做論文引用,族群不同,踩雷點真的不一樣。

我用「如果…那你大概會…」這種方式講,會比較像聊天群組在丟判斷題。

  • 如果你是外食族、生活節奏很亂:你大概會對「內在狀態」特別有感,因為外部 reward 常常就是短期爽感;你讀這套可以盯著 cortisol/壓力回饋 怎麼避免系統變成一直衝刺的怪物。
  • 如果你是夜班或輪班(作息破碎那種):你可能會直接抓 homeostasis 這個字,因為你最懂「狀態漂移」;你看模型時,會更在意它能不能處理延遲、噪聲、以及長期漂移。
  • 如果你是親子族(要跟小孩/家人互動):你對 oxytocin/社會連結 這塊會敏感,因為互動品質比「任務完成率」更像 KPI;你讀 2025 的 EPQ 會更想問:它怎麼避免把關係變成分數?
  • 如果你是銀髮或照護情境的家屬:你可能第一個想的是風險:情緒估計會不會誤判、會不會造成錯誤對待;你會比較希望看到的是「透明度」與「可撤回」,而不是更炫的指數。
  • 如果你是做研究/工程的人:你八成會想吐槽四件套太少,但又會承認它是個好起點;你會更在意參數怎麼校準、怎麼做 ablation、怎麼做 cross-condition validation。
圖 4(Comparison Chart):控制迴路取向 vs. 指數量化取向,一眼看差異
圖 4(Comparison Chart):控制迴路取向 vs. 指數量化取向,一眼看差異

我自己的偏見(但我會承認):真正的門檻在「可驗證」

我其實不太怕有人提出新名詞,EPQ 也好、digital homeostasis 也好,名詞多到爆都沒差。

我怕的是:你把它包裝得像理解情緒,結果驗證只停在「看起來合理」

而驗證這件事,偏偏很不浪漫。要做對照、要拆分量、要看漂移、要看不同環境下是不是還站得住。

講到這裡突然想到 Panksepp 那本《Affective neuroscience》,他那種寫法就是:你要談情緒可以,但你得回到可觀測、可重複的東西。這種態度放在 AI 上其實也一樣。

短句:別騙自己。

「內在狀態」不是拿來寫得很像人,而是拿來讓系統在複雜環境裡少一點失控。

最後:有人會反對什麼?我先幫你講出來

我大概猜得到反對意見會長怎樣:

  • 反對 1:「把情緒變成四個化學物質太粗暴。」——對,粗暴。但粗暴不等於沒用,前提是你承認它是模型不是人。
  • 反對 2:「這些荷爾蒙/神經化學在真實生物裡更複雜。」——沒錯,所以更需要把「模型邊界」寫清楚,不然就會被誤讀成偽科學。
  • 反對 3:「EPQ 這種指數會被濫用。」——也對,所以風險控管要跟著框架一起長,不是等出事才補。

我比較想聽的是:你覺得這種「四件套 + 回饋迴路/合成指數」的路線,最大價值是在 AI 自我調節,還是在 人機互動的可量化

如果你覺得兩個都不是,也行,那你覺得它會死在哪個環節——驗證?硬體延遲?還是倫理?

圖 5(Two-column Trend Compare):常見誤解 vs. 比較站得住腳的理解
圖 5(Two-column Trend Compare):常見誤解 vs. 比較站得住腳的理解

免責聲明:本文是在整理與解讀公開論文/預印本的概念,屬於研究討論,不是醫療或心理評估用途;神經化學名詞在此為模型抽象,不等同個人健康狀態判讀。

Related to this topic:

Comments