記者 俞陶然 見習(xí)記者 李昂
最近,上海巖思類腦人工智能研究院與復(fù)旦大學(xué)附屬華山醫(yī)院合作,在腦機(jī)接口領(lǐng)域取得突破。10例受試者的大腦植入電極后,經(jīng)過短時間訓(xùn)練,通過解碼其大腦神經(jīng)電活動,與腦部電極相連的電腦就會實(shí)時顯示出他們想說的中文語句。這一進(jìn)入臨床試驗(yàn)階段的科研成果,將為漸凍癥、腦卒中等失語患者帶來福音。
腦機(jī)接口是實(shí)現(xiàn)大腦與外部設(shè)備信息交互的交叉前沿技術(shù),在醫(yī)療、康養(yǎng)、教育等領(lǐng)域有廣闊的應(yīng)用前景。近年來,上海在全國率先開展腦機(jī)接口關(guān)鍵技術(shù)的系統(tǒng)性布局,培育產(chǎn)學(xué)研醫(yī)深度融合的創(chuàng)新生態(tài),已涌現(xiàn)出一批國內(nèi)領(lǐng)先的科研成果。
通過解碼大腦神經(jīng)活動實(shí)現(xiàn)“意念說話”這一突破,就源自產(chǎn)學(xué)研醫(yī)深度融合的創(chuàng)新生態(tài)。華山醫(yī)院院長毛穎介紹,在市科委支持下,華山醫(yī)院利用多年積累的臨床資源,建立了一個高質(zhì)量顱內(nèi)腦電數(shù)據(jù)庫。同時,華山醫(yī)院與國內(nèi)多家神經(jīng)外科頭部醫(yī)院組建了iBrain腦電數(shù)據(jù)聯(lián)盟。巖思類腦等加入聯(lián)盟的成員單位可獲得高質(zhì)量顱內(nèi)腦電數(shù)據(jù)集,用于腦機(jī)接口技術(shù)和產(chǎn)品研發(fā)。
“在這個全球最大的人類顱內(nèi)腦電數(shù)據(jù)庫支持下,我們團(tuán)隊(duì)已研發(fā)出腦電大模型,它類似于ChatGPT的底層預(yù)訓(xùn)練模型,能精準(zhǔn)讀取腦電信號的意圖。”巖思類腦首席科學(xué)家李孟教授說。
解讀語言方面的腦電信號,是腦電大模型的重要功能。據(jù)介紹,解讀中文的腦電信號比英文難得多,因?yàn)橛⑽牡囊羲刂挥薪?0個,而中文的聲母、韻母、四聲的排列組合,使音素多達(dá)400個以上。憑借先進(jìn)的多腦區(qū)立體腦電協(xié)同解碼技術(shù),以及高質(zhì)量顱內(nèi)腦電數(shù)據(jù)集的支撐,巖思類腦應(yīng)用其自研的腦電大模型破解了這個復(fù)雜語言系統(tǒng)難題。目前,腦電大模型對中文聲母的識別準(zhǔn)確率超83%,韻母識別準(zhǔn)確率超84%,達(dá)到行業(yè)領(lǐng)先水平。
參加臨床試驗(yàn)的癲癇受試者此前已植入多根sEEG(立體定向腦電圖)電極,在模型訓(xùn)練階段,他們耗時100分鐘,朗讀了54個漢字。在訓(xùn)練過程中,電極采集了受試者不同腦區(qū)、不同深度的腦電信號,將它們輸入腦電大模型。這是一個模型微調(diào)過程,腦電大模型將受試者讀出的54個漢字拆分成聲母和韻母,精準(zhǔn)識別它們對應(yīng)的腦電信號,進(jìn)而利用“聲母/韻母—音節(jié)—單字—語句”四級解碼架構(gòu),為每一名受試者構(gòu)建了個性化的腦電大模型。
臨床試驗(yàn)顯示,腦電大模型可在54個漢字訓(xùn)練集基礎(chǔ)上,解讀出1951個常用漢字,外推率高達(dá)1∶36,具有很強(qiáng)的泛化性。半秒鐘內(nèi),大模型就能解讀出一個完整的中文語句,且語句字?jǐn)?shù)沒有限制,理論上可達(dá)到很高的輸出率。
李孟認(rèn)為,這一腦機(jī)接口技術(shù)突破意味著能把人的想法準(zhǔn)確、高效地轉(zhuǎn)化成文字。今后,它不僅能讓失語患者重獲語言表達(dá)能力,還能利用大腦神經(jīng)活動解碼生成的文字獲得其他能力,如用意念操控物理智能設(shè)備、與元宇宙進(jìn)行交互,或利用多模態(tài)大模型繪畫,把腦海中的語言轉(zhuǎn)化為表達(dá)夢想的畫作。