記者 俞陶然
人工智能大模型的興起,讓GPU(圖形處理器)算力成為極其重要的資源。在這個領(lǐng)域,GPU算力云服務(wù)扮演著重要角色,可以實現(xiàn)算力資源跨地區(qū)、跨行業(yè)的自由流動。最近,國家級專精特新“小巨人”企業(yè)——上海道客,聯(lián)合行業(yè)伙伴發(fā)布了“d.run算力一體化方案”。這個方案包括上海、合肥等地的算力中心服務(wù),算法開發(fā)、模型微調(diào)等模型開發(fā)工具以及智能應(yīng)用、流程編排等應(yīng)用開發(fā)工具,為用戶提供一個AI算力生態(tài)平臺。
AI基礎(chǔ)設(shè)施
近5年來,我國算力產(chǎn)業(yè)規(guī)??焖僭鲩L,年均增速超過30%,但還存在核心芯片和國產(chǎn)基礎(chǔ)軟件生態(tài)不強、傳輸能力不足、無效算力增多等挑戰(zhàn)。上海道客創(chuàng)始人、首席執(zhí)行官陳齊彥認(rèn)為,大模型興起后,除了GPU芯片供給不足,我國人工智能產(chǎn)業(yè)還面臨協(xié)同服務(wù)、落地應(yīng)用等方面的問題。如何提高國內(nèi)已有算力的使用效率?這需要包括云服務(wù)供應(yīng)商在內(nèi)的算力產(chǎn)業(yè)鏈上所有企業(yè)的共同努力,打造出全方位的算力一體化解決方案。
2014年,來自易安信EMC中國研究院的陳齊彥團(tuán)隊走上創(chuàng)業(yè)道路,他們專注于云原生領(lǐng)域,使上海道客逐漸成長為這一領(lǐng)域的頭部企業(yè)。所謂云原生,是一系列云技術(shù)和開發(fā)管理方法的集合,它們試圖在動態(tài)環(huán)境中尋找最優(yōu)解,可通過調(diào)度發(fā)揮算力的最大效能,實現(xiàn)算力資源的靈活按需分配。在云原生開源社區(qū),道客對核心開源項目Kubernetes的貢獻(xiàn)度排名全球第三,僅次于谷歌和紅帽公司。
如今,這家上海企業(yè)基于云原生技術(shù),與猴子無限等企業(yè)聯(lián)手開發(fā)了旨在讓算力更自由的“d.run算力一體化方案”。訪問d.run,記者看到4個板塊:算力集群、模型應(yīng)用、模型工具和管理。在算力集群板塊,用戶可購買上海、合肥等地的GPU算力;在模型應(yīng)用板塊,可使用語料庫、各種插件和數(shù)據(jù)分析工具,對垂直類模型應(yīng)用進(jìn)行訓(xùn)練和評測;在模型工具板塊,多種算法開發(fā)、模型微調(diào)類工具供用戶選擇,包括訓(xùn)練大模型所必需的數(shù)據(jù)集。
“我們希望借助這個平臺打通從GPU供應(yīng)到協(xié)同服務(wù),再到落地應(yīng)用的產(chǎn)業(yè)鏈,讓AI基礎(chǔ)設(shè)施像水和電一樣流向客戶,助力提升我國人工智能產(chǎn)業(yè)的有效算力,化算力為‘算利’。”陳齊彥在發(fā)布會上說。
“智能體工作流”
作為上海道客的合作伙伴,北京猴子無限公司為d.run開發(fā)了流程編排模塊。這家企業(yè)獲得了奇績創(chuàng)壇創(chuàng)始人、百度原總裁陸奇的投資,專注于模型調(diào)優(yōu)。公司創(chuàng)始人、首席執(zhí)行官尹伯昊介紹,斯坦福大學(xué)教授、著名人工智能專家吳恩達(dá)最近在社交平臺X上表示:“智能體工作流”今年將推動人工智能快速發(fā)展,其智能水平可能超過下一代基礎(chǔ)大模型。
什么是“智能體工作流”?目前,大語言模型根據(jù)提示詞輸出一篇文章,是直接生成的,這相當(dāng)于人類寫文章時不做任何修改,所以文章質(zhì)量往往并不是很高。“智能體工作流”則與人類寫文章的過程很接近,將工作流程分為寫提綱、收集信息、寫初稿、修改初稿等若干步驟。在執(zhí)行每個步驟時,用戶都可以介入,讓“智能體工作流”生成的內(nèi)容更符合自己的要求。
對于吳恩達(dá)的觀點,尹伯昊十分認(rèn)同:“流程數(shù)據(jù)是通向智能體的鑰匙,流程驅(qū)動可以讓大模型更優(yōu)、更快地落地。”為此,他帶領(lǐng)團(tuán)隊正在構(gòu)建以流程為中心的大模型落地平臺,并與上海道客合作,將“流程編排”模塊嵌入d.run平臺。在云原生的高可用環(huán)境中,很多企業(yè)可以為AI開放生態(tài)平臺賦能,構(gòu)建一套體系化流程,助力用戶更快地開發(fā)出高質(zhì)量的AI大模型應(yīng)用。
吳恩達(dá)團(tuán)隊的實驗研究發(fā)現(xiàn):在零樣本條件下,GPT-3.5生成內(nèi)容的正確率為48.1%,GPT-4的正確率達(dá)到67.0%;如果采用“智能體工作流”模式,GPT-3.5的正確率高達(dá)95.1%,遠(yuǎn)超GPT-4。這個對比實驗給尹伯昊團(tuán)隊帶來了很大信心,而在“實戰(zhàn)”環(huán)境中,以流程為中心的大模型落地平臺能否催生高質(zhì)量的AI大模型應(yīng)用?還有待用戶檢驗。