“在大語(yǔ)言模型領(lǐng)域,,DeepSeek在提升效率上有獨(dú)特的認(rèn)知,,而效率的優(yōu)化的理念在視頻模型領(lǐng)域已經(jīng)扎根,,因此大概率不會(huì)出現(xiàn)這種一下子‘遙遙領(lǐng)先’的模型,我們期待視頻模型更可控,、更好用,、每個(gè)人都能用到?!鼻迦A大學(xué)人工智能研究院副院長(zhǎng),、生數(shù)科技創(chuàng)始人兼首席科學(xué)家朱軍告訴新京報(bào)貝殼財(cái)經(jīng)記者。
3月27日至31日,,2025中關(guān)村論壇年會(huì)舉行,。在去年的中關(guān)村論壇上,朱軍發(fā)布了對(duì)標(biāo)Sora的首個(gè)國(guó)產(chǎn)自研視頻大模型Vidu,,受到了廣泛關(guān)注,。而2025中關(guān)村論壇上,朱軍在主題演講中發(fā)布了業(yè)內(nèi)首個(gè)高可控視頻大模型Vidu Q1,,并在會(huì)后接受了新京報(bào)貝殼財(cái)經(jīng)記者的采訪,。
Q代表“質(zhì)量” 高可控背后是基礎(chǔ)模型能力提升
本次回歸中關(guān)村論壇,朱軍帶來(lái)了更為強(qiáng)大的 Vidu Q1模型,,他告訴記者,,Q代表“Quality(質(zhì)量)”,即高質(zhì)量,、高可控,,這本身實(shí)際上是基礎(chǔ)模型能力的提升,“目前階段投入基礎(chǔ)模型的收益還是最大的,,加上基礎(chǔ)模型之上的一些技術(shù)創(chuàng)新,,從后端可以更好地實(shí)現(xiàn)高一致性和高可控的結(jié)果?!?/p>
貝殼財(cái)經(jīng)記者通過(guò)視頻演示發(fā)現(xiàn),,Vidu Q1模型在位置、運(yùn)動(dòng)布局,、音頻等多個(gè)領(lǐng)域?qū)崿F(xiàn)了可控升級(jí),。以多主體細(xì)節(jié)可控為例,在語(yǔ)義指令的基礎(chǔ)上,,通過(guò)融入?yún)⒖紙D的視覺(jué)指令,,Vidu Q1支持對(duì)所有動(dòng)作行為(出場(chǎng)、退場(chǎng),、坐立姿態(tài),、行動(dòng)路線)進(jìn)行精準(zhǔn)調(diào)整,從而用更低的抽卡率實(shí)現(xiàn)更高質(zhì)量的可控生成,。
朱軍介紹,,Vidu在商業(yè)化方面一直是C端與B端并重,,不過(guò)目前C端由于面向全球,增長(zhǎng)速度很快,,因此視頻模型的技術(shù)突破可以更好地服務(wù)廣大用戶,。而B(niǎo)端則面向國(guó)內(nèi)市場(chǎng),目前已經(jīng)看到了對(duì)MaaS(模型即服務(wù))的廣泛需求,,今年也會(huì)繼續(xù)同步推進(jìn)兩種業(yè)務(wù),。
“去年,,Vidu在中關(guān)村論壇開(kāi)幕前一周時(shí)實(shí)現(xiàn)了技術(shù)突破,,因此也被邀請(qǐng)來(lái)到這樣一個(gè)高端平臺(tái)上進(jìn)行展示。而今年是論壇一周年,,也是Vidu大模型的一周年,,因此也想在這里傳達(dá)一些進(jìn)展?!敝燔姼嬖V新京報(bào)貝殼財(cái)經(jīng)記者,。
視頻模型最重要的是效率 中國(guó)視頻模型引領(lǐng)全球
朱軍表示,目前大語(yǔ)言模型領(lǐng)域有能力非常領(lǐng)先的頭部公司,,但視頻模型領(lǐng)域完全不同,,“現(xiàn)在可以認(rèn)為中國(guó)的視頻模型在全球,于很多方面是處于引領(lǐng)地位的,?!?/p>
“另外,視頻模型的商業(yè)化路徑會(huì)更快,,大家對(duì)視頻模型的消費(fèi)和需求非常廣闊,,所以視頻和文字的賽道不一樣。目前頭部的視頻大模型各自都有特色,、差異化的商業(yè)化的路徑,,并沒(méi)有像語(yǔ)言模型處于紅海狀態(tài)?!敝燔娬f(shuō),。
在他看來(lái),視頻大模型的發(fā)展,,更重要的還要看團(tuán)隊(duì)能否持續(xù)創(chuàng)新,,行業(yè)上公司的密度還比較稀疏,大概率不會(huì)出現(xiàn)一家獨(dú)大的情況,。
另外,,新京報(bào)貝殼財(cái)經(jīng)記者注意到,今年以來(lái)DeepSeek引領(lǐng)起了大模型的開(kāi)源浪潮,,阿里云也推出了開(kāi)源版本的視頻模型,。對(duì)此,,朱軍回應(yīng)稱,DeepSeek最打動(dòng)用戶的點(diǎn)還是效果好,、效率高,,“我們認(rèn)為從視頻模型的角度來(lái)說(shuō),用戶最關(guān)心的還是質(zhì)量和效率,?!?/p>
編輯:李華山