久久精品国产亚洲av麻豆网站,熟妇人妻无乱码中文字幕真矢织江,国产又黄又猛又粗又爽的A片,一区二区无码免费视频网站

中自數(shù)字移動傳媒

您的位置:首頁 >> 綜合新聞 >> 大模型迭代迎來新法則,誰將從中受益?

大模型迭代迎來新法則,誰將從中受益?

已有418次閱讀2025-06-11標簽:
 
大模型Scaling Law(規(guī)模定律)將失效?長期以來,大模型的發(fā)展遵循依靠模型參數(shù)增加、數(shù)據(jù)集規(guī)模擴充以優(yōu)化模型性能的規(guī)模定律。但隨著可用于預訓練的開源數(shù)據(jù)挖掘殆盡、模型訓練所需的算力資源緊缺,大模型發(fā)展遵循的Scaling Law即將失效。

在近日舉行的清華大學基礎(chǔ)模型2025學術(shù)年會上,清華大學計算機科學與技術(shù)系副教授劉知遠表示,“密度法則”將接替Scaling Law成為最新大模型迭代規(guī)律。根據(jù)這一法則,端側(cè)智能將迎來廣闊發(fā)展前景。

“密度法則”成為大模型發(fā)展新定律?

“芯片電路密度(即芯片計算單元數(shù)量與芯片面積的比值)每18個月翻1倍。”這是集成電路行業(yè)熟悉的摩爾定律。




劉知遠提出的“密度法則”與這一規(guī)律類似,指大模型知識密度將每100天翻1倍;谶@一定律,劉知遠認為,模型將朝著參數(shù)小型化、成本普惠的方向發(fā)展,并提出基于該定律的四條推論:

推論一:實現(xiàn)特定AI水平的模型參數(shù)呈指數(shù)下降,實現(xiàn)相同智能水平的模型參數(shù)量每3.3個月下降一半,同時模型推理速度提升一倍。例如,2024年2月發(fā)布的2.4B規(guī)模的MiniCPM-1,能力與2023年9月發(fā)布的7B規(guī)模Mistral相當,但參數(shù)量僅相當于后者的35%。

推論二:模型推理開銷隨時間呈指數(shù)級下降。例如,在過去20個月內(nèi),GPT-3.5級模型的API價格下降至原先的1/266.7,約2.5個月下降一半,而更低的價格將會帶來更多的應(yīng)用。

推論三:模型訓練開銷隨時間迅速下降。高質(zhì)量互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模約為15T,可訓練的模型最大參數(shù)約為750B,但1年后,僅需58B參數(shù)模型便可實現(xiàn)相同能力。推論四:大模型能力密度呈加速增強趨勢。ChatGPT發(fā)布之前,大模型能力密度約按每4.8個月增加1倍的速度增長;ChatGPT發(fā)布后,大模型密度倍增時間縮短至3.2個月。

模型小型化彰顯端側(cè)AI能力

“密度法則”下,模型將沿著這樣的路徑發(fā)展:同等智能水平模型的訓練、推理開銷等成本降低,模型規(guī)?s小,能力密度持續(xù)增強。與此同時,在摩爾定律仍在發(fā)揮作用的情況下,端側(cè)芯片的承載能力仍在增強。



這意味著,隨著時間的推演,將出現(xiàn)能力水平非常高的大模型,同時其參數(shù)規(guī)模能夠縮小到一定的程度,使其能夠裝載到消費級計算設(shè)備上。屆時,端側(cè)AI能力將得以彰顯。但將運行在云端的PB級的知識規(guī)模濃縮到GB級的小模型參數(shù)中,是一項具備挑戰(zhàn)性的工作。如何進行海量互聯(lián)網(wǎng)數(shù)據(jù)的治理、如何利用數(shù)據(jù)背后的知識實現(xiàn)模型高效學習以實現(xiàn)大模型的科學化制備,將成為未來大模型構(gòu)建的關(guān)鍵課題。

智能算法創(chuàng)新遠未收斂

在過去5年中,一項項技術(shù)創(chuàng)新推動著大模型的發(fā)展:2018年出現(xiàn)的自監(jiān)督預訓練技術(shù),使大模型具備了掌握人類知識的能力。但這一階段,模型只是實現(xiàn)了學習,還不能實現(xiàn)模型應(yīng)用;2021年,有監(jiān)督的微調(diào)技術(shù),使模型具備了理解人類意圖的能力,可從用戶的負責指令中挖掘出人類的真實意圖,并調(diào)用自己掌握的知識,完成該指令。

2025年,模型借助強化學習技術(shù),具備了深度思考的能力,可以在完成任務(wù)之前,像人一樣深思熟慮,通過一步一步的思考給出準確的回答。面向未來,劉知遠認為,智能算法創(chuàng)新和演進遠遠沒有收斂,未來人工智能邁向AGI(通用人工智能)過程中還要不斷拓展能力樹,這也是人工智能邁向的核心任務(wù)之一。其需要拓展的能力包括自主學習、合作、創(chuàng)新創(chuàng)造等。如果停止算法創(chuàng)新,則將落后于其他發(fā)展AI能力的行業(yè)參與者。

就像人類個體具備一定智能水平之后,其彼此之間通過協(xié)同實現(xiàn)了群體智能涌現(xiàn)一樣,劉知遠認為,人工智能在結(jié)束個體的智能涌現(xiàn)之后,將通過多智能體群聚,迎來群體智能的第二次涌現(xiàn)。就像互聯(lián)網(wǎng)把全球信息和人連接在一起,群體智能就有機會通過智能體互聯(lián)網(wǎng)連接在一起,實現(xiàn)智能的二次涌現(xiàn)。制定智能體接入與溝通協(xié)議,有利于異質(zhì)智能體溝通協(xié)作,共同完成任務(wù)。且不同專業(yè)能力的智能體有機結(jié)合,將完成個體所不能勝任的更復雜的任務(wù)。

 

分享到:

[ 新聞搜索 ]  [ ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關(guān)閉窗口 ]  [ 返回頂部 ]

0條 [查看全部]  網(wǎng)友評論

移動互聯(lián)

2010年,中國移動互聯(lián)網(wǎng)用戶規(guī)模達到3.03億人2011年,中國移動互聯(lián)網(wǎng)行業(yè)進入了更加快速發(fā)展的一年,無論是用戶規(guī)模還是手機應(yīng)用下載次數(shù)都有了快速的增長。在移動互聯(lián)網(wǎng)發(fā)展的大的趨勢下,中自傳媒已經(jīng)開始進行區(qū)別于傳統(tǒng)互聯(lián)網(wǎng)的運營模式探索,伴隨著產(chǎn)業(yè)鏈和產(chǎn)業(yè)格局的變化提供創(chuàng)新的服務(wù)

更多>>推薦視頻

工業(yè)轉(zhuǎn)型升級-中國電器工業(yè)協(xié)會電力電子分會 秘書長 肖向鋒

工業(yè)轉(zhuǎn)型升級-中國電器工業(yè)協(xié)會

在本次2012北京國際工業(yè)自動化展上,我們將全面剖析在新...
中國高壓變頻器產(chǎn)業(yè)發(fā)展之路——走過十三年 李玉琢

中國高壓變頻器產(chǎn)業(yè)發(fā)展之路——

中國高壓變頻器產(chǎn)業(yè)發(fā)展之路走過十三年 李玉琢
從企業(yè)家角度 談行業(yè)的未來發(fā)展——匯川技術(shù)股份有限公司

從企業(yè)家角度 談行業(yè)的未來發(fā)展

從企業(yè)家角度 談行業(yè)的未來發(fā)展匯川技術(shù)股份有限公司
現(xiàn)代能源變換的核心技術(shù)——電力電子 李崇堅

現(xiàn)代能源變換的核心技術(shù)——電力

中國電工技術(shù)學會常務(wù)理事---李崇堅,電力電子是先進能源...
打造專業(yè)電力電子元器件品牌 助力變頻器產(chǎn)業(yè)發(fā)展

打造專業(yè)電力電子元器件品牌 助

聯(lián)合主辦單位深圳市智勝新電子有限公司領(lǐng)導嘉賓致辭 7月...