全球通用自動(dòng)駕駛公司第一股文遠(yuǎn)知行在無(wú)錫又有大動(dòng)作。日前,其旗下全資子公司景爍科技“高端大模型訓(xùn)練基地”項(xiàng)目落地?zé)o錫經(jīng)開區(qū),引入以大模型數(shù)據(jù)精標(biāo)人才為主的團(tuán)隊(duì),并以此為基礎(chǔ)申報(bào)國(guó)家級(jí)大模型數(shù)據(jù)標(biāo)注基地。
在當(dāng)今人工智能蓬勃發(fā)展的時(shí)代,大模型無(wú)疑是其中最為耀眼的明星,人們熟知的DeepSeek、豆包等皆屬于大模型類產(chǎn)品。而這些大模型為何能如此“機(jī)智”?這離不開 “訓(xùn)練師”——“數(shù)據(jù)標(biāo)注”的幫助。
數(shù)據(jù)標(biāo)注是人工智能產(chǎn)業(yè)鏈中不可或缺的一環(huán),對(duì)大模型的原始數(shù)據(jù)進(jìn)行處理和標(biāo)記,讓大模型更智慧、更像人。這些原始數(shù)據(jù)涵蓋了文本、圖像、音頻等各種形式,它們就像未經(jīng)雕琢的璞玉,雜亂無(wú)章地存在著。數(shù)據(jù)標(biāo)注員們?nèi)缤妓嚲康墓そ常鶕?jù)不同的需求和標(biāo)準(zhǔn),為這些數(shù)據(jù)賦予特定的標(biāo)簽和注釋。
“目前翻譯類大模型,很難將中文的古詩(shī)貼切地翻譯為英文。”景爍科技相關(guān)負(fù)責(zé)人舉例,但通過人工不斷校準(zhǔn),向大模型不斷輸入人的想法與思維邏輯,大模型能準(zhǔn)確、優(yōu)美地翻譯古詩(shī)將成為可能。
景爍科技的目標(biāo)正是要利用人工智能等技術(shù),逐步扭轉(zhuǎn)數(shù)據(jù)標(biāo)注一貫以來(lái)“人力密集”的標(biāo)簽。“我們已自研一款智能化專業(yè)工具。”景爍科技相關(guān)負(fù)責(zé)人透露,在景爍科技的一個(gè)項(xiàng)目中,有大量的摳圖需求,起初客戶通過人工使用摳圖軟件來(lái)實(shí)現(xiàn),但景爍科技的專業(yè)工具則能自動(dòng)識(shí)別衣服的邊界,實(shí)現(xiàn)AI輕松“摳圖”,后續(xù)只需人工微調(diào)即可,節(jié)省一半的時(shí)間。經(jīng)過比較,該客戶果斷選擇景爍科技的專業(yè)工具。
“在無(wú)錫的‘落子’,本身就是布局未來(lái)。” 景爍科技代表告訴記者,隨著各類大模型的出現(xiàn),專業(yè)、細(xì)分的垂類大模型將成為市場(chǎng)的主流,但這對(duì)數(shù)據(jù)標(biāo)注工作的專業(yè)度與邏輯力提出了更高的要求。而無(wú)錫擁有醫(yī)藥、集成電路、新能源等豐厚的產(chǎn)業(yè)底蘊(yùn),為企業(yè)在各產(chǎn)業(yè)專業(yè)度的培養(yǎng)提供“肥沃的土壤”。景爍科技也將積極投身無(wú)錫“465”現(xiàn)代產(chǎn)業(yè)集群建設(shè),依托無(wú)錫經(jīng)開區(qū)的算力優(yōu)勢(shì),以人工智能大模型推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、新興產(chǎn)業(yè)壯大,并引入上下游企業(yè)落戶經(jīng)開區(qū),打造長(zhǎng)三角最大規(guī)模的高端大模型數(shù)據(jù)標(biāo)注基地。
自全省首個(gè)數(shù)據(jù)要素產(chǎn)業(yè)園(先行區(qū))落地經(jīng)開區(qū)以來(lái),經(jīng)開區(qū)積極發(fā)揮產(chǎn)業(yè)科技創(chuàng)新的優(yōu)勢(shì),加快科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新深度融合:與中科曙光共同部署的先進(jìn)計(jì)算中心,是經(jīng)開區(qū)聚力打造數(shù)字產(chǎn)業(yè)的人工智能算力底座;去年7月,全省首個(gè)數(shù)據(jù)要素產(chǎn)業(yè)園落戶經(jīng)開,為推動(dòng)產(chǎn)業(yè)數(shù)字化、數(shù)字產(chǎn)業(yè)化再添籌碼。這些在數(shù)字經(jīng)濟(jì)發(fā)展方面的“先手棋”,促成了經(jīng)開區(qū)較好的數(shù)字產(chǎn)業(yè)基礎(chǔ),有利于數(shù)據(jù)標(biāo)注產(chǎn)業(yè)快速扎根發(fā)芽。
未來(lái),經(jīng)開區(qū)將與景爍科技等人工智能企業(yè)一道,不斷深化合作內(nèi)容,拓展合作領(lǐng)域,共同應(yīng)對(duì)數(shù)據(jù)標(biāo)注基地建設(shè)、人工智能發(fā)展中的機(jī)遇與挑戰(zhàn);并以此次合作為契機(jī),集聚科技型與資源型龍頭企業(yè),吸引高質(zhì)量數(shù)據(jù)服務(wù)提供商,發(fā)掘前沿性、革命性、顛覆性研究應(yīng)用,培育本地的數(shù)字經(jīng)濟(jì)人才,持續(xù)帶動(dòng)數(shù)字產(chǎn)業(yè)化項(xiàng)目落地,加速經(jīng)開區(qū)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展。