“2025年人工智能發(fā)展呈現(xiàn)兩大特點(diǎn):第一個(gè)是多模態(tài),大模型能處理文字、圖像、視頻;第二個(gè)就是人工智能將應(yīng)用于GDP密切相關(guān)的行業(yè),中國(guó)在推動(dòng)AI落地方面具有顯著優(yōu)勢(shì)。”
在近日舉行的2025搜狐科技年度論壇上,清華大學(xué)計(jì)算機(jī)系教授、中國(guó)工程院院士鄭緯民表示,目前國(guó)產(chǎn)GPU性能逐漸提升,但核心障礙在于生態(tài)兼容性不足,“好消息是,全國(guó)已有3萬(wàn)余家企業(yè)投入研發(fā)”。
“當(dāng)前大模型訓(xùn)練主要依賴兩類系統(tǒng),除了國(guó)產(chǎn)GPU,另外就是英偉達(dá)的GPU,其硬件性能與生態(tài)成熟度領(lǐng)先,但面臨價(jià)格高漲和一卡難求的困境。”
鄭緯民建議從兩方面突破,一方面確保降低開發(fā)者學(xué)習(xí)成本,通過(guò)習(xí)慣遷移重塑生態(tài);另一方面提升國(guó)產(chǎn)GPU硬件性能,即便起步晚、進(jìn)程難,只要性能基本達(dá)標(biāo),配合生態(tài)優(yōu)化,仍可吸引用戶。
“所以要構(gòu)建國(guó)產(chǎn)系統(tǒng)的基礎(chǔ)軟件非常重要,需集中資源做好一些核心軟件。”鄭緯民建議,比如我們先做出10個(gè)好用的軟件。
在大模型領(lǐng)域也可通過(guò)微調(diào)專門訓(xùn)練一些好用的垂類大模型,構(gòu)建好生態(tài)建設(shè)。鄭緯民稱,在基礎(chǔ)大模型基礎(chǔ)上,把金融的數(shù)據(jù)進(jìn)行第二次訓(xùn)練,就能得到一個(gè)金融大模型。模型微調(diào),實(shí)際上就是在基礎(chǔ)大模型基礎(chǔ)上,對(duì)某一個(gè)領(lǐng)域數(shù)據(jù)第二次訓(xùn)練,得到某一個(gè)領(lǐng)域的大模型。
編輯:李華山