6月24日,2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)在北京揭曉。由科大訊飛等單位牽頭的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目摘獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。這是科大訊飛繼2002年和2011年分別獲得國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)二等獎(jiǎng)之后,首次獲得國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng),實(shí)現(xiàn)了合肥本土企業(yè)作為牽頭單位獲得一等獎(jiǎng)的“零的突破”。這也是過(guò)去十年人工智能領(lǐng)域首個(gè)國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)。
獲獎(jiǎng)項(xiàng)目——
“超級(jí)翻譯師”助力無(wú)障礙溝通
“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目具體是什么?為何能獲得國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng)?
作為該項(xiàng)目的第一完成單位,科大訊飛的相關(guān)負(fù)責(zé)人告訴記者,該項(xiàng)目包含多語(yǔ)種語(yǔ)音識(shí)別、多語(yǔ)種語(yǔ)音合成、多語(yǔ)種翻譯技術(shù)等為一體的綜合技術(shù),支持69個(gè)語(yǔ)種,除了6個(gè)聯(lián)合國(guó)通用語(yǔ)種(漢語(yǔ)、英語(yǔ)、法語(yǔ)、西班牙語(yǔ)、俄語(yǔ)、阿拉伯語(yǔ))之外,還包括挪威語(yǔ)、丹麥語(yǔ)等小語(yǔ)種63個(gè),均達(dá)到使用門(mén)檻。同時(shí),該項(xiàng)目還覆蓋了維、藏、蒙、哈、朝、壯、彝等24種主要中國(guó)方言,未來(lái)還將覆蓋更多方言。
簡(jiǎn)而言之,科大訊飛打造出了一個(gè)“超級(jí)翻譯師”。
語(yǔ)音是人類(lèi)最自然便捷的溝通方式,也是智能設(shè)備人機(jī)交互的關(guān)鍵入口。這一“超級(jí)翻譯師”是如何打造成功的?這就要追溯到科大訊飛十余年的技術(shù)攻堅(jiān)。
“在這個(gè)項(xiàng)目中,我們?cè)陉P(guān)鍵技術(shù)上主要取得了四大突破,達(dá)到國(guó)際領(lǐng)先水平。”科大訊飛相關(guān)負(fù)責(zé)人解釋,在復(fù)雜語(yǔ)音信號(hào)解耦建模、多語(yǔ)種共享建模、語(yǔ)音語(yǔ)義聯(lián)合建模、國(guó)產(chǎn)異構(gòu)硬件平臺(tái)訓(xùn)練及推理加速等四大關(guān)鍵技術(shù)方面,由科大訊飛牽頭的“合肥技術(shù)”均取得了巨大突破。
例如在語(yǔ)音識(shí)別研究中,最具挑戰(zhàn)的是遠(yuǎn)場(chǎng)、噪聲、多人語(yǔ)音混疊等現(xiàn)象,對(duì)此,科大訊飛提出了多通道語(yǔ)音信號(hào)時(shí)空分離建模方法和多維度語(yǔ)音屬性解耦表征方法,使得復(fù)雜場(chǎng)景下語(yǔ)音識(shí)別準(zhǔn)確率得到重大突破。
在這些技術(shù)的支撐下,科大訊飛連續(xù)4屆獲得國(guó)際多通道語(yǔ)音分離和識(shí)別比賽CHIME冠軍;連續(xù)8屆獲得國(guó)際語(yǔ)音合成大賽Blizzard Challenge冠軍。2015年,相關(guān)技術(shù)首次在大會(huì)演講場(chǎng)景實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)寫(xiě)超過(guò)人類(lèi)速記員水平;2019年起連續(xù)六年服務(wù)全國(guó)兩會(huì)。
又如在復(fù)雜應(yīng)用場(chǎng)景下,語(yǔ)音交互、語(yǔ)音翻譯面臨著深層次語(yǔ)義理解困難、專業(yè)性不足等問(wèn)題。對(duì)此,科大訊飛提出語(yǔ)音語(yǔ)義互增強(qiáng)的魯棒口語(yǔ)理解技術(shù)和多源知識(shí)增強(qiáng)的可信文本生成技術(shù),有效提升語(yǔ)音交互、語(yǔ)音翻譯、專有詞匯及領(lǐng)域知識(shí)引用等復(fù)雜場(chǎng)景的語(yǔ)義理解準(zhǔn)確率。
這一技術(shù)在英語(yǔ)口語(yǔ)評(píng)測(cè)已經(jīng)應(yīng)用,首次達(dá)到人類(lèi)專家水平,是唯一滿足高考應(yīng)用要求的技術(shù),累計(jì)服務(wù)超1.3億考生。
成果轉(zhuǎn)化——
3年實(shí)現(xiàn)直接經(jīng)濟(jì)效益超500億元
多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)持續(xù)突破,如何實(shí)現(xiàn)產(chǎn)業(yè)化?科大訊飛選擇攻堅(jiān)國(guó)產(chǎn)異構(gòu)硬件平臺(tái)訓(xùn)練,打造出一個(gè)可以“百搭”千行百業(yè)的大模型平臺(tái),解決智能語(yǔ)音技術(shù)硬件平臺(tái)的關(guān)鍵問(wèn)題。
目前,科大訊飛已建成5個(gè)國(guó)產(chǎn)化集群,語(yǔ)音合成、識(shí)別、翻譯、交互等國(guó)產(chǎn)化能力日服務(wù)8.73億次。2023年,科大訊飛與華為聯(lián)合攻關(guān)大模型國(guó)產(chǎn)化算力底座核心難題,建設(shè)首個(gè)萬(wàn)卡全國(guó)產(chǎn)算力平臺(tái)“飛星一號(hào)”,填補(bǔ)了國(guó)產(chǎn)超大模型訓(xùn)練平臺(tái)的空白。
“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目的不斷優(yōu)化,也支撐著智能制造產(chǎn)業(yè)的升級(jí)和中國(guó)企業(yè)出海。
比如由該項(xiàng)目衍生出的車(chē)載智能化產(chǎn)品,目前已累計(jì)前裝超5300萬(wàn)套,支持奇瑞、一汽、長(zhǎng)安等車(chē)企超200萬(wàn)套訂單出海。科大訊飛2017年開(kāi)始承建的智能語(yǔ)音國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái),已聚集平臺(tái)開(kāi)發(fā)者數(shù)700.7萬(wàn),終端設(shè)備數(shù)40.5億,海外開(kāi)發(fā)者數(shù)超過(guò)40萬(wàn),構(gòu)建出自主可控的多語(yǔ)種智能語(yǔ)音技術(shù)及全球產(chǎn)業(yè)生態(tài)。
技術(shù)升級(jí),帶來(lái)產(chǎn)業(yè)生態(tài)生生不息。近3年來(lái),“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目累計(jì)實(shí)現(xiàn)直接經(jīng)濟(jì)效益 521.28 億元,并帶動(dòng)由工信部和安徽省政府共建、以科大訊飛為核心的“中國(guó)聲谷”產(chǎn)業(yè)集聚發(fā)展,上升為中部崛起的“國(guó)家戰(zhàn)略”。
產(chǎn)業(yè)發(fā)展——
2400家企業(yè)匯聚人工智能產(chǎn)業(yè)鏈
十年磨一劍,科大訊飛牽頭的“多語(yǔ)種智能語(yǔ)音關(guān)鍵技術(shù)及產(chǎn)業(yè)化”項(xiàng)目摘獲國(guó)家科學(xué)技術(shù)進(jìn)步獎(jiǎng)一等獎(jiǎng),實(shí)現(xiàn)了合肥本土企業(yè)作為牽頭單位獲得一等獎(jiǎng)“零的突破”,也給予了合肥發(fā)展人工智能產(chǎn)業(yè)更多的信心。
近年來(lái),合肥將人工智能產(chǎn)業(yè)納入“6+5+X”產(chǎn)業(yè)集群體系,全面布局人工智能產(chǎn)業(yè),獲批國(guó)家人工智能戰(zhàn)新產(chǎn)業(yè)集群,產(chǎn)業(yè)實(shí)力躋身全國(guó)第一方陣。目前,合肥集聚人工智能產(chǎn)業(yè)領(lǐng)域上下游企業(yè)2400家左右,在《2023-2024中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》城市排行榜中,合肥居第8位。
為給予產(chǎn)業(yè)助力,合肥落戶省人工智能主題基金,發(fā)起設(shè)立省智能語(yǔ)音機(jī)人工智能創(chuàng)業(yè)投資基金;與高校院所共建創(chuàng)新平臺(tái),累計(jì)建設(shè)人工智能領(lǐng)域新研機(jī)構(gòu)16家,組建國(guó)家新一代人工智能開(kāi)發(fā)創(chuàng)新平臺(tái)等高能級(jí)平臺(tái)77家;構(gòu)建“云計(jì)算+智能計(jì)算+超級(jí)計(jì)算”錯(cuò)位互補(bǔ)格局,布局元宇宙產(chǎn)業(yè),組建全國(guó)首家省市級(jí)工業(yè)元宇宙5G創(chuàng)新研究中心。
值得期待的是,6月27日,合肥人工智能產(chǎn)業(yè)又將迎來(lái)新的研發(fā)進(jìn)展——科大訊飛將正式發(fā)布訊飛星火V4.0,底座能力全面對(duì)標(biāo)GPT-4 Turbo,國(guó)產(chǎn)語(yǔ)音大模型也將迎來(lái)全新升級(jí)。
合肥通客戶端-合報(bào)全媒體記者 劉小容