成人免费AV网址|亚洲手机免费在线|最新av网址发布|67194成人草|在线国产视频91|一区二区无码竹菊|91国产精品综合|日本熟女综合视频|国产免费强奸视频|最近中文字幕99

上海

首頁>地方頻道>上海>要聞

上海高校企業(yè)去年就在用DeepSeek做開發(fā)

  記者 俞陶然

  深度求索公司研發(fā)的DeepSeek大模型最近“出圈”。其實(shí),國內(nèi)學(xué)術(shù)界和產(chǎn)業(yè)界使用這個系列的大模型已有一段時間。記者昨天采訪時了解到,上海交通大學(xué)計算機(jī)科學(xué)與工程系教授趙海去年已棄用GPT-4,改用DeepSeek-V3生成合成數(shù)據(jù),開發(fā)垂類大模型。

  達(dá)觀數(shù)據(jù)公司去年5月引入DeepSeek-V2大模型,開發(fā)辦公智能體(Agent),取得很好的效果。“DeepSeek的性價比極高,而且全面開源,對產(chǎn)業(yè)應(yīng)用很友好。”達(dá)觀數(shù)據(jù)董事長、首席執(zhí)行官陳運(yùn)文說。

  近年來,趙海團(tuán)隊利用GPT-4等基座大模型,為政府和企業(yè)開發(fā)了十多個垂類大模型。在開發(fā)過程中,基座大模型的主要作用是生成合成數(shù)據(jù)。這類數(shù)據(jù)通過人工方式生成,而不是從真實(shí)世界中獲取,用于訓(xùn)練大模型。“我用過一些國產(chǎn)基座大模型,它們的效果和GPT-4比起來,還是有一定差距。”趙海告訴記者,“但使用DeepSeek-V3后,我發(fā)現(xiàn)它的性能與GPT-4處于同一量級,而價格只有GPT-4的十分之一,所以現(xiàn)在不用GPT-4了。”

  與趙海團(tuán)隊相比,達(dá)觀數(shù)據(jù)使用DeepSeek更早。陳運(yùn)文介紹,DeepSeek-V2是一個精簡高效的開源模型,只需要相對低配的GPU和顯卡內(nèi)存,就能讓辦公智能體獲得很好的推理效果。DeepSeek-V3發(fā)布后,這家上海人工智能企業(yè)立即成為它的用戶。陳運(yùn)文介紹,“V3對GPU資源的使用效率極高,DeepSeek這種低資源、高效果的特性有利于今后大規(guī)模推廣應(yīng)用。”

  本月發(fā)布的推理大模型DeepSeek-R1在復(fù)雜的數(shù)學(xué)和邏輯任務(wù)上表現(xiàn)優(yōu)秀,達(dá)觀數(shù)據(jù)使用后,大幅度提升了辦公智能體在審閱處理復(fù)雜工程報告、金融文書、財務(wù)報表、招投標(biāo)書等專業(yè)文檔上的能力。

  趙海認(rèn)為,大模型發(fā)展歷程可分為三個階段:第一階段的標(biāo)志性事件是ChatGPT問世,其表現(xiàn)令人驚艷,但因?yàn)椴婚_源,大多數(shù)開發(fā)者并不清楚這個大模型是如何開發(fā)出來的;在第二階段,很多團(tuán)隊重現(xiàn)了ChatGPT開發(fā)過程,涌現(xiàn)出Llama、Qwen等一批開源大模型,這類模型的性能越來越強(qiáng),但與OpenAI發(fā)布的大模型相比,存在一定差距;DeepSeek-V3和DeepSeek-R1則開啟了第三階段,它們的性能可分別比肩GPT-4和OpenAI o1,意味著開源大模型終于追趕上了閉源大模型。

  趙海說,通過深度求索發(fā)布的技術(shù)報告,全球開發(fā)者都分享到了中國研發(fā)團(tuán)隊的創(chuàng)新智慧??梢灶A(yù)見,DeepSeek將引發(fā)大模型創(chuàng)新和產(chǎn)業(yè)生態(tài)的變革。

聲明:本媒體部分圖片、文章來源于網(wǎng)絡(luò),版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系刪除:025-84707368,廣告合作:025-84708755。
1336
收藏
分享