近日,在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(簡稱AIIA)第十四次全體會議暨人工智能賦能新型工業(yè)化深度行(南京站)活動上,全國首個可信AI智能體測試床建設(shè)工作正式啟動。
近年來,智能體作為當(dāng)前大模型應(yīng)用落地的重要方式,能夠?qū)⒛P湍芰D(zhuǎn)化為解決實(shí)際問題能力,呈現(xiàn)出蓬勃發(fā)展的態(tài)勢。但是智能體在實(shí)際應(yīng)用落地過程中,依然面臨工作流程繁雜、協(xié)作邏輯不清晰、應(yīng)用場景多樣化等諸多挑戰(zhàn),中國信通院高度關(guān)注智能體技術(shù)及其應(yīng)用發(fā)展,圍繞技術(shù)研究、標(biāo)準(zhǔn)研制、評估測試等方面推動智能體高質(zhì)量發(fā)展,并于近期啟動智能體測試床聯(lián)合建設(shè)單位征集工作,得到業(yè)內(nèi)企業(yè)和專家的高度關(guān)注和支持。
此次中國信通院聯(lián)合聯(lián)通數(shù)科、中國移動研究院、華為、百度、VIVO、中興通訊等單位,在南京啟動可信AI智能體測試床建設(shè),旨在打造一體化的測試環(huán)境,對智能體的理解分析、規(guī)劃決策、通信交互、任務(wù)執(zhí)行等能力進(jìn)行全面驗(yàn)證和優(yōu)化。技術(shù)架構(gòu)上,在資源配置層,系統(tǒng)配置智能體測試床的基礎(chǔ)資源,包括計(jì)算設(shè)施、數(shù)據(jù)資源、網(wǎng)絡(luò)設(shè)施、操作系統(tǒng)、基礎(chǔ)軟件等;在環(huán)境構(gòu)建層,主要構(gòu)建智能體測試環(huán)境,包括運(yùn)行腳本調(diào)試、數(shù)據(jù)可視分析等基礎(chǔ)測試環(huán)境,以及模型接入、智能體部署等運(yùn)營管理環(huán)境;在任務(wù)測試層,重點(diǎn)面向MCP協(xié)議驗(yàn)證測試、單智能體基準(zhǔn)測試、多智能體協(xié)同測試等典型任務(wù)建設(shè)測試體系。
下一步,南京將依托建設(shè)啟動契機(jī),推動導(dǎo)入可信AI智能體測試床建設(shè)主體資源,吸引更多AI智能體企業(yè)來南京布局發(fā)展。同時,推動南京人工智能企業(yè)積極支撐參與測試床建設(shè),為國家人工智能產(chǎn)業(yè)發(fā)展貢獻(xiàn)更多南京力量。