中國社會科學報記者 陸航
2025年春節(jié)期間,國產(chǎn)大模型DeepSeek成為全球AI領(lǐng)域的一顆新星。DeepSeek開源版本在文本生成、代碼編寫、邏輯推理等任務中表現(xiàn)優(yōu)異。這一突破不僅打破了美國在生成式AI領(lǐng)域的絕對優(yōu)勢,更以百倍性價比提升的實踐路徑,為我國AI發(fā)展注入一劑強心針。2月8日,“DeepSeek影響與啟示”特別論壇在西安舉行。與會學者聚焦DeepSeek的技術(shù)突破、行業(yè)變革以及對未來發(fā)展的啟示,共同探討如何通過技術(shù)創(chuàng)新與自主研發(fā)提升我國人工智能競爭力。
技術(shù)創(chuàng)新為全行業(yè)
注入新的活力與信心
DeepSeek是源于算法、軟件與硬件的系統(tǒng)性協(xié)同創(chuàng)新成果。浙江大學人工智能研究所所長吳飛認為,DeepSeek的精彩表現(xiàn)是眾智和眾力相互疊加的成果。盡管DeepSeek模型基于Transformer架構(gòu),并非顛覆性基礎理論創(chuàng)新,但是DeepSeek的確是AI漫漫征途中的精彩一躍,也為AI未來發(fā)展帶來了深刻啟示。事實上,AI發(fā)展迄今取得的成就都是由過往一次次“精彩一躍”繪就而成。2024年,諾貝爾物理學獎授予AI就是這樣一個注解:約翰·霍普菲爾德和杰弗里·辛頓分別從物理學能量最小和玻爾茲曼分布角度優(yōu)化神經(jīng)網(wǎng)絡模型參數(shù),為當下深度學習的崛起打下了堅實的歷史樁基。DeepSeek“漸進式突破”路徑證明,通過系統(tǒng)工程優(yōu)化同樣能實現(xiàn)跨越式發(fā)展,科技創(chuàng)新中不可忽視系統(tǒng)級工程創(chuàng)新的作用。
DeepSeek之所以實現(xiàn)了百倍性價比提升,其中一個重要原因是在系統(tǒng)軟件層面的深度創(chuàng)新。在清華大學計算機科學與技術(shù)系教授翟季冬看來,算法、軟件、硬件的協(xié)同創(chuàng)新,是打破傳統(tǒng)大模型依賴算力范式的關(guān)鍵。DeepSeek首先是算法層次的創(chuàng)新,采用了新的MoE架構(gòu),即共享專家和大量細粒度路由專家架構(gòu)。通過將通用知識壓縮到共享專家中,減輕路由專家的參數(shù)冗余,提高參數(shù)效率;在保持參數(shù)總量不變的前提下,劃分更多的細粒度路由專家,通過靈活地組合路由專家,更準確和有針對性地進行知識表達。同時,通過負載均衡的算法設計,有效緩解了傳統(tǒng)MoE模型因負載不均衡帶來的訓練效率低下問題。在系統(tǒng)軟件層次,DeepSeek采用了大量精細化的系統(tǒng)工程優(yōu)化。算法和軟件的創(chuàng)新與優(yōu)化,極大地降低了模型的訓練成本。DeepSeek給我們的啟示,更多在于如何在有限的算力情況下,通過算法和軟件的協(xié)同創(chuàng)新,充分挖掘硬件的極致性能。這對中國未來人工智能發(fā)展至關(guān)重要,也對國內(nèi)大模型發(fā)展具有啟示意義。
隨著深度學習時代的到來,機器學習理論的緩慢演進已逐漸落后于技術(shù)水平的飛速發(fā)展,機器學習理論與技術(shù)之間開始產(chǎn)生越來越大的鴻溝。大量“啟發(fā)式”技術(shù)發(fā)現(xiàn)的深度學習性能表現(xiàn)無法找到有效的理論解釋,重建現(xiàn)代機器學習理論體系已成為該領(lǐng)域需要迫切突破的核心瓶頸。若無法實現(xiàn)這一目標而任由機器學習/深度學習走向“煉金術(shù)式”工程化,更多缺乏可控性、安全性、解釋性的技術(shù)難題將會不可避免地滋生,導致以科學性為前提的學科大廈面臨行將傾覆的危局。
西安交通大學數(shù)學與統(tǒng)計學院教授、大數(shù)據(jù)分析與計算分析工程實驗室統(tǒng)計與大數(shù)據(jù)中心常務副主任孟德宇通過分析機器學習傳統(tǒng)統(tǒng)計學習理論體系的特點與局限,綜合介紹了以大模型為代表的現(xiàn)代機器學習技術(shù)廣泛呈現(xiàn)的三大難題:“任務泛化能力”現(xiàn)象所揭示的學習理論泛化范疇局限難題、“智能涌現(xiàn)”現(xiàn)象所揭示的學習理論泛化趨勢偏差難題及“魯棒—精度悖論”現(xiàn)象所揭示的學習理論泛化邊界缺失難題。他強調(diào),隨著現(xiàn)代工程技術(shù)的蓬勃發(fā)展,特別是DeepSeek技術(shù)使機器學習能力開始更加廣泛地普惠大眾,重塑機器學習理論根基以闡釋這些現(xiàn)象背后的數(shù)理機理,使機器學習成為一門兼具理論完備性與技術(shù)有效性的學科,已成為當今人工智能領(lǐng)域亟須面對且不可回避的關(guān)鍵科學問題。
自主研發(fā)
提升我國人工智能競爭力
技術(shù)創(chuàng)新與自主研發(fā)對于提升我國人工智能競爭力至關(guān)重要。我們不能盲目跟隨大公司的步伐,而應堅定地相信自身技術(shù)能力,發(fā)揮自身技術(shù)優(yōu)勢,這一點對于確保我國在人工智能領(lǐng)域的持續(xù)領(lǐng)先地位尤為關(guān)鍵。
DeepSeek為全球AI技術(shù)發(fā)展帶來了獨特的貢獻和創(chuàng)新,它在算法優(yōu)化、模型泛化能力等方面的突破,不僅推動了AI技術(shù)的邊界拓展,也為其他領(lǐng)域的技術(shù)創(chuàng)新提供了有益借鑒。論壇專家呼吁產(chǎn)業(yè)界和學術(shù)界應合力培養(yǎng)人才、突破原始理論,在基礎方法和產(chǎn)業(yè)應用研究中共同發(fā)揮創(chuàng)新優(yōu)勢。為維持并增強這種創(chuàng)新勢頭,政府、企業(yè)、高校和研究機構(gòu)各方需進一步加強協(xié)作,共同優(yōu)化資源配置,確保人才培養(yǎng)與行業(yè)需求相匹配、教育內(nèi)容與科技前沿相銜接、科技創(chuàng)新成果迅速轉(zhuǎn)化為實際生產(chǎn)力。
自主研發(fā)是提升我國人工智能競爭力的核心路徑。當前,全球AI技術(shù)競爭已進入白熱化階段,我國在應用場景、數(shù)據(jù)規(guī)模和政策支持上具有顯著優(yōu)勢,但在基礎算法、高端芯片、開源框架等核心技術(shù)領(lǐng)域仍存在“卡脖子”問題。如何通過自主研發(fā)實現(xiàn)技術(shù)突破、構(gòu)建自主可控的產(chǎn)業(yè)生態(tài),是我國搶占全球AI戰(zhàn)略制高點的關(guān)鍵。
提升AI競爭力是一場關(guān)乎國運的戰(zhàn)略博弈。西安電子科技大學人工智能學院副院長李甫表示,通過“硬件突圍—軟件筑基—算法創(chuàng)新—應用推廣”四位一體的自主研發(fā)路徑,我國有望在2025—2030年實現(xiàn)關(guān)鍵領(lǐng)域自主可控,構(gòu)建起具有全球影響力的AI創(chuàng)新體系。這不僅需要技術(shù)突破,更需要制度創(chuàng)新與開放合作的智慧——既要打破技術(shù)枷鎖,也要避免“閉門造車”,在自主可控與全球化協(xié)作中尋找動態(tài)平衡。
智能化技術(shù)在提升性能和增效方面發(fā)揮著不可替代的作用。DeepSeek的成功不僅在于其卓越的技術(shù),更在于它能夠與智能硬件實現(xiàn)無縫對接,形成強大的生態(tài)協(xié)同效應,從而極大地推動AI技術(shù)在各行各業(yè)的廣泛應用。人工智能模型的開源為實現(xiàn)人人可用的普遍智能帶來曙光。西北工業(yè)大學計算機學院教授、智能感知與計算工信部重點實驗室副主任郭斌認為,大模型推理成本的降低,將對工業(yè)界和其他多個領(lǐng)域產(chǎn)生積極影響,DeepSeek將為中國產(chǎn)業(yè)發(fā)展注入新的活力,特別是在海外市場,有望帶動國內(nèi)硬件廠商和產(chǎn)業(yè)的全球布局,為全球產(chǎn)業(yè)創(chuàng)造更多機遇,為人類進步和發(fā)展作出貢獻。
DeepSeek的躍升絕非偶然,而是我國AI發(fā)展模式轉(zhuǎn)型的縮影——從“市場換技術(shù)”轉(zhuǎn)向“創(chuàng)新驅(qū)動”,從“單點突破”升級為“系統(tǒng)攻堅”。這條道路既非完全自主封閉,也非被動跟隨,而是在關(guān)鍵領(lǐng)域構(gòu)筑“技術(shù)主權(quán)”的同時,通過開源協(xié)作、標準輸出、生態(tài)共建,深度參與全球創(chuàng)新網(wǎng)絡。軟件生態(tài)的建設不易,硬件生態(tài)的形成則更為困難。我們只有建立起完善的創(chuàng)新生態(tài)體系,通過海外部署軟件帶動國內(nèi)硬件產(chǎn)業(yè)的發(fā)展,才能持續(xù)推動AI技術(shù)的蓬勃發(fā)展,為區(qū)域經(jīng)濟和社會發(fā)展注入強大動力,并為全球科技提供一個“中國選擇”。這一策略不僅能夠促進國內(nèi)經(jīng)濟發(fā)展,也有助于提升我國在全球科技競爭中的地位。未來,隨著國家超算互聯(lián)網(wǎng)、東數(shù)西算工程等基礎設施的完善,我國有望在AI芯片、框架、算法三大領(lǐng)域?qū)崿F(xiàn)自主化率新突破。中國AI正以“有限算力+無限智慧”書寫智能時代的中國方案。
論壇由陜西省計算機學會、中國計算機學會(CCF)西安會員活動中心等單位聯(lián)合舉辦。
轉(zhuǎn)自:中國社會科學網(wǎng)