成人免费AV网址|亚洲手机免费在线|最新av网址发布|67194成人草|在线国产视频91|一区二区无码竹菊|91国产精品综合|日本熟女综合视频|国产免费强奸视频|最近中文字幕99

合肥

首頁>地方頻道>合肥>要聞

合肥建設(shè)高質(zhì)量數(shù)據(jù)集 激活城市有機(jī)生命體

數(shù)據(jù)被譽(yù)為數(shù)字經(jīng)濟(jì)時代的“新石油”,價值巨大。如何將其“煉化”成驅(qū)動人工智能(AI)奔騰向前的“高標(biāo)號汽油”?合肥正全力作答:通過構(gòu)建高質(zhì)量數(shù)據(jù)集,激活千行百業(yè)創(chuàng)新蝶變,描繪智慧城市新圖景。

解碼核心:何為高質(zhì)量數(shù)據(jù)集?

數(shù)字經(jīng)濟(jì)時代,數(shù)據(jù)“石油”成為驅(qū)動社會發(fā)展的核心生產(chǎn)要素。但未經(jīng)“提煉”的原始數(shù)據(jù),往往裹挾著噪聲與混亂,唯有經(jīng)過系統(tǒng)性整合,才能發(fā)揮真正的價值——建設(shè)高質(zhì)量數(shù)據(jù)集就是讓數(shù)據(jù)價值從“潛在”走向“現(xiàn)實(shí)”的關(guān)鍵一步。

中國信息通信研究院副院長魏亮曾作過形象的比喻:“數(shù)據(jù)之于大模型,就像石油之于汽車。原油只有經(jīng)過一系列復(fù)雜的過程煉化成汽油后,才能供汽車使用。同樣,海量原始數(shù)據(jù)需要經(jīng)過‘煉化’形成高質(zhì)量數(shù)據(jù)集,才能助力大模型精準(zhǔn)學(xué)習(xí)數(shù)據(jù)特征與規(guī)律。”

簡單說,高質(zhì)量數(shù)據(jù)集是指經(jīng)過采集、加工等數(shù)據(jù)處理,可直接用于開發(fā)和訓(xùn)練人工智能模型,能有效提升模型性能的數(shù)據(jù)的集合。與原始數(shù)據(jù)相比,高質(zhì)量數(shù)據(jù)集具有三個顯著特征:一是主題明確,圍繞特定目標(biāo)系統(tǒng)化組織;二是質(zhì)量達(dá)標(biāo),在多個維度達(dá)到較高標(biāo)準(zhǔn);三是即用性強(qiáng),經(jīng)過處理后可直接輸入AI模型。

“想象一下,剛設(shè)計出的人工智能(AI)和大模型算法,就像個‘新生兒’,高質(zhì)量數(shù)據(jù)集就是它的‘啟蒙教材’,能引導(dǎo)它從懵懂走向睿智。”安徽數(shù)據(jù)堂科技有限公司(以下簡稱“數(shù)據(jù)堂”)副總經(jīng)理張子斌的解釋更接地氣。

如何高效“編寫教材”?AI技術(shù)本身就成了關(guān)鍵幫手。張子斌介紹,10年前人工標(biāo)注是主力,比如手動框選圖片中的橘子、雞蛋等,效率很低。如今,數(shù)據(jù)堂的“數(shù)加加”人工智能標(biāo)注平臺創(chuàng)新應(yīng)用AI輔助標(biāo)注技術(shù),讓人工智能反哺標(biāo)注過程,效率得以大幅提升,“同樣的工作量,現(xiàn)在只需過去20%的人工時間”。

近日,數(shù)據(jù)堂發(fā)布多語種大模型預(yù)訓(xùn)練數(shù)據(jù)集、多模態(tài)大模型數(shù)據(jù)集、語音識別與計算機(jī)視覺訓(xùn)練數(shù)據(jù)集,全面助力企業(yè)打造更高精度、更強(qiáng)泛化能力的AI模型,應(yīng)對全球用戶多樣化的語言與應(yīng)用場景需求,為智能升級提供堅實(shí)數(shù)據(jù)支撐。

那么,高質(zhì)量數(shù)據(jù)集到底藏著哪些“超能力”?

往民生看,醫(yī)生有了“診斷助手”,通過使用AI輔助,為居民生成個性化健康建議;學(xué)校化身“智慧老師”,依托大模型技術(shù),為每個學(xué)生精準(zhǔn)畫像,實(shí)現(xiàn)因材施教。

向產(chǎn)業(yè)瞧,工廠裝上“火眼金睛”,自動化生產(chǎn)線如臂使指,次品率大幅下降;AI客服變成“貼心管家”,從“答非所問”到“精準(zhǔn)回應(yīng)”,讓體驗(yàn)感進(jìn)一步提升。

合肥市數(shù)據(jù)資源管理局相關(guān)負(fù)責(zé)人介紹,合肥將持續(xù)建設(shè)高質(zhì)量數(shù)據(jù)集,為人工智能產(chǎn)業(yè)提供充足“養(yǎng)分”,從而進(jìn)行不同場景的訓(xùn)練優(yōu)化,推動大模型在千行百業(yè)落地應(yīng)用。

釋放動能:構(gòu)建“智慧+”新圖景

高質(zhì)量數(shù)據(jù)集,如同流淌在城市脈絡(luò)中的“智慧血液”,正深度融入合肥的產(chǎn)業(yè)肌理與生活場景。

走進(jìn)合肥高新區(qū),人工智能初創(chuàng)企業(yè)智象未來(合肥)信息技術(shù)有限公司(以下簡稱“智象未來”)正“揮舞”著多模態(tài)數(shù)據(jù)的“數(shù)字畫筆”。這家全球領(lǐng)先的生成式AI創(chuàng)新企業(yè),自主研發(fā)了超百億參數(shù)的“智象多模態(tài)大模型”,依托行業(yè)中最豐富的多模態(tài)版權(quán)語料庫,展現(xiàn)出強(qiáng)大的視覺內(nèi)容生成與理解能力。作為首批完成“模型+算法”雙備案的國產(chǎn)多模態(tài)大模型,它生成的視頻內(nèi)容邏輯嚴(yán)密、流暢自然、畫質(zhì)高清。

2025年4月,智象未來的開源圖像生成模型HiDream-I1在24小時內(nèi)登頂國際權(quán)威榜單Artificial Analysis,成為首款躋身全球第一梯隊(duì)的中國自研生成式AI模型,一舉刷新圖像質(zhì)量、語義理解與藝術(shù)表現(xiàn)三大維度紀(jì)錄,這背后離不開高質(zhì)量數(shù)據(jù)集的有效支撐。

在金融領(lǐng)域,高質(zhì)量數(shù)據(jù)集又“扮演”成洞察風(fēng)險的“智能雷達(dá)”。

合肥大智慧財匯數(shù)據(jù)科技有限公司深耕金融領(lǐng)域23年,擁有海量金融數(shù)據(jù)及企業(yè)數(shù)據(jù)資源。該公司以構(gòu)建高質(zhì)量數(shù)據(jù)集為核心,深度融合人工智能與大數(shù)據(jù)技術(shù),自主研發(fā)企業(yè)圖譜、風(fēng)險傳導(dǎo)模型等智能化分析工具,實(shí)現(xiàn)數(shù)據(jù)價值的深度挖掘與高效轉(zhuǎn)化。其標(biāo)桿產(chǎn)品“企業(yè)預(yù)警通”,通過實(shí)時追蹤企業(yè)關(guān)聯(lián)關(guān)系、輿情異動及監(jiān)管信號,已為超200萬金融從業(yè)者提供精準(zhǔn)、及時的風(fēng)險預(yù)警服務(wù)。

同時,在城市街頭也有“數(shù)據(jù)身影”。合肥公安交警部門通過升級部署900萬像素高清智能攝像頭,將交通監(jiān)管精度推向新高度。這些“鷹眼”不僅能精準(zhǔn)識別車牌,更能清晰捕捉駕駛艙內(nèi)細(xì)節(jié)——安全帶是否系牢、有無駕車使用手機(jī)或抽煙等危險行為,盡收“眼”底。

合肥市公安局交通警察支隊(duì)交通科研所副所長尹成勝說:“系統(tǒng)深度融合人臉識別技術(shù),通過數(shù)據(jù)碰撞,可以快速確認(rèn)駕駛員身份。這套覆蓋汽車、非機(jī)動車等全出行工具的系統(tǒng),如同一位不知疲倦的‘電子交警’,可以有效規(guī)范秩序,為市民出行織密安全防護(hù)網(wǎng)。”

聚力成勢:打造數(shù)據(jù)產(chǎn)業(yè)新高地

去年5月,阿里研究院發(fā)布的《大模型訓(xùn)練數(shù)據(jù)白皮書》顯示,互聯(lián)網(wǎng)上中文語料和英文語料占比存在顯著差異:在全球網(wǎng)站中,英文占比高達(dá)59.8%,而中文僅占1.3%。

“大模型是概率分布模型,其使用的數(shù)據(jù)來源分布將使得模型具備與之相似的人類意志。因此,在訓(xùn)練中融入更多中式價值觀的內(nèi)容,能讓它更貼合中文使用者的文化底色與價值傾向,在全球化浪潮中守護(hù)文化的多樣與獨(dú)特。所以,構(gòu)建高質(zhì)量數(shù)據(jù)集意義非凡,也刻不容緩。”合肥市數(shù)據(jù)資源管理局資源處相關(guān)負(fù)責(zé)人說。

作為國家“數(shù)據(jù)要素×”三年行動計劃的積極踐行者,合肥先后打出《合肥數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展規(guī)劃(2025—2027 年)》《合肥市促進(jìn)數(shù)商發(fā)展的指導(dǎo)意見》《深化數(shù)據(jù)領(lǐng)域綜合改革推進(jìn)城市化轉(zhuǎn)型的實(shí)施意見》等政策“組合拳”,計劃2025年結(jié)合人工智能等產(chǎn)業(yè)發(fā)展需要,組織推進(jìn)人工智能、低空經(jīng)濟(jì)、交通物流、金融信息、公共安全、醫(yī)療教育等重點(diǎn)領(lǐng)域高質(zhì)量數(shù)據(jù)集建設(shè),全年打造不少于10個高質(zhì)量數(shù)據(jù)集;到2027年,拉動標(biāo)注產(chǎn)業(yè)規(guī)模突破30億元,建成覆蓋汽車、醫(yī)療、交通等領(lǐng)域不少于30個行業(yè)數(shù)據(jù)空間。

政策是方向,肯定強(qiáng)信心。近日,合肥市大數(shù)據(jù)行業(yè)黨委聯(lián)合市數(shù)據(jù)產(chǎn)業(yè)協(xié)會開展了行業(yè)評優(yōu)評先活動,一批“數(shù)據(jù)要素×”領(lǐng)軍企業(yè)、數(shù)據(jù)行業(yè)領(lǐng)軍企業(yè)、高成長大數(shù)據(jù)企業(yè)和數(shù)據(jù)人才新星脫穎而出。

在合肥,創(chuàng)新活力奔涌,越來越多的科創(chuàng)新苗正拔節(jié)生長:飛數(shù)安徽針對多語種多模態(tài)科研數(shù)據(jù)獲取難、高質(zhì)量數(shù)據(jù)匱乏等問題,研發(fā)智能化生產(chǎn)工具,賦能跨學(xué)科科研創(chuàng)新;云智數(shù)界深耕文化創(chuàng)意領(lǐng)域,通過構(gòu)建高質(zhì)量文化創(chuàng)意數(shù)據(jù)集,推動數(shù)字文旅產(chǎn)業(yè)從傳統(tǒng)業(yè)態(tài)向數(shù)字化、場景化、IP化轉(zhuǎn)型升級;互聯(lián)智庫專注政務(wù)數(shù)據(jù)治理,整合近千萬條標(biāo)準(zhǔn)化12345熱線數(shù)據(jù),提高政務(wù)服務(wù)響應(yīng)效率......

截至目前,合肥市大數(shù)據(jù)企業(yè)達(dá)2246家,逐漸形成“多點(diǎn)開花、集群發(fā)展”的產(chǎn)業(yè)格局。隨著政策紅利持續(xù)釋放、產(chǎn)學(xué)研協(xié)同不斷深化、企業(yè)創(chuàng)新活力加速迸發(fā),合肥必將在數(shù)字經(jīng)濟(jì)的浪潮中,刻下更鮮明的“印記”,讓數(shù)據(jù)價值真正轉(zhuǎn)化為發(fā)展動能、民生福祉。

聲明:本媒體部分圖片、文章來源于網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系刪除:025-84707368,廣告合作:025-84708755。
880
收藏
分享