構(gòu)建更加通用的人工智能,讓模型具有更加廣泛和通用的認(rèn)知能力,是當(dāng)前人工智能(AI)領(lǐng)域發(fā)展的重要目標(biāo)。目前流行的大模型路徑是基于Scaling Law(尺度定律)去構(gòu)建更大、更深和更寬的神經(jīng)網(wǎng)絡(luò),可稱之為“基于外生復(fù)雜性”的通用智能實(shí)現(xiàn)方法。這一路徑面臨著計(jì)算資源及能源消耗難以為繼、可解釋性不足等問(wèn)題。中國(guó)科學(xué)院自動(dòng)化研究所李國(guó)齊、徐波研究團(tuán)隊(duì)聯(lián)合清華大學(xué)、北京大學(xué)等借鑒大腦神經(jīng)元復(fù)雜動(dòng)力學(xué)特性,提出了“基于內(nèi)生復(fù)雜性”的類(lèi)腦神經(jīng)元模型構(gòu)建方法,改善了傳統(tǒng)模型通過(guò)向外拓展規(guī)模帶來(lái)的計(jì)算資源消耗問(wèn)題,為有效利用神經(jīng)科學(xué)發(fā)展人工智能提供了示例。
本研究首先展示了脈沖神經(jīng)網(wǎng)絡(luò)神經(jīng)元LIF(Leaky?Integrate and Fire)模型和HH(Hodgkin-Huxley)模型[1]在動(dòng)力學(xué)特性上存在等效性,進(jìn)一步從理論上證明了HH神經(jīng)元可以和四個(gè)具有特定連接結(jié)構(gòu)的時(shí)變參數(shù)LIF神經(jīng)元(tv-LIF)動(dòng)力學(xué)特性等效。基于這種等效性,團(tuán)隊(duì)通過(guò)設(shè)計(jì)微架構(gòu)提升計(jì)算單元的內(nèi)生復(fù)雜性,使HH網(wǎng)絡(luò)模型能夠模擬更大規(guī)模LIF網(wǎng)絡(luò)模型的動(dòng)力學(xué)特性,在更小的網(wǎng)絡(luò)架構(gòu)上實(shí)現(xiàn)與之相似的計(jì)算功能。進(jìn)一步,團(tuán)隊(duì)將由四個(gè)tv-LIF神經(jīng)元構(gòu)建的“HH模型”(tv-LIF2HH)簡(jiǎn)化為s-LIF2HH模型,通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了這種簡(jiǎn)化模型在捕捉復(fù)雜動(dòng)力學(xué)行為方面的有效性。
實(shí)驗(yàn)結(jié)果表明HH網(wǎng)絡(luò)模型和s-LIF2HH網(wǎng)絡(luò)模型在表示能力和魯棒性上具有相似的性能,驗(yàn)證了內(nèi)生復(fù)雜性模型在處理復(fù)雜任務(wù)時(shí)的有效性和可靠性。同時(shí),研究發(fā)現(xiàn)HH網(wǎng)絡(luò)模型在計(jì)算資源消耗上更為高效,顯著減少了內(nèi)存和計(jì)算時(shí)間的使用,從而提高了整體的運(yùn)算效率。研究團(tuán)隊(duì)通過(guò)信息瓶頸理論對(duì)上述研究結(jié)果進(jìn)行了解釋。
為將神經(jīng)科學(xué)的復(fù)雜動(dòng)力學(xué)特性融入人工智能,為構(gòu)筑人工智能與神經(jīng)科學(xué)的橋梁提供了新的方法和理論支持,為實(shí)際應(yīng)用中的AI模型優(yōu)化和性能提升提供了可行的解決方案。目前,研究團(tuán)隊(duì)已開(kāi)展對(duì)更大規(guī)模HH網(wǎng)絡(luò),以及具備更大內(nèi)生復(fù)雜性的多分支多房室神經(jīng)元的研究,有望進(jìn)一步提升大模型計(jì)算效率與任務(wù)處理能力,實(shí)現(xiàn)在實(shí)際應(yīng)用場(chǎng)景中的快速落地。
該工作發(fā)表在《Nature Computational Science》,共同通訊作者是中國(guó)科學(xué)院自動(dòng)化所李國(guó)齊研究員、徐波研究員,北京大學(xué)田永鴻教授。共同一作是清華大學(xué)錢(qián)學(xué)森班的本科生何林軒(自動(dòng)化所實(shí)習(xí)生),數(shù)理基科班本科生徐蘊(yùn)輝(自動(dòng)化所實(shí)習(xí)生),清華大學(xué)精儀系博士生何煒華和林逸晗。
論文鏈接:https://www.nature.com/articles/s43588-024-00674-9
評(píng)論鏈接:https://www.nature.com/articles/s43588-024-00677-6
[1] HH神經(jīng)元模型,全稱為Hodgkin-Huxley模型,由英國(guó)生理學(xué)家Alan Hodgkin和Andrew Huxley在1952年基于魷魚(yú)巨型軸突的電生理實(shí)驗(yàn)數(shù)據(jù)提出,用以描述神經(jīng)脈沖的產(chǎn)生和傳導(dǎo),并因此獲得了1963年的諾貝爾醫(yī)學(xué)或生理學(xué)獎(jiǎng)。該模型是一組描述神經(jīng)元細(xì)胞膜電生理現(xiàn)象的非線性微分方程,直接反映了細(xì)胞膜上離子通道的開(kāi)閉情況及其與膜電位變化之間的關(guān)系。HH模型是神經(jīng)科學(xué)領(lǐng)域中的一個(gè)重要里程碑,它首次從分子水平上解釋了動(dòng)作電位的產(chǎn)生機(jī)制,為后續(xù)神經(jīng)元電生理研究奠定了基礎(chǔ)。
來(lái)源:中國(guó)科學(xué)院自動(dòng)化研究所