在人工智能引領(lǐng)的科技浪潮中,國(guó)產(chǎn)視頻大模型正悄然走在前列,成為全球科技創(chuàng)新的重要力量。3月29日,在中關(guān)村論壇年會(huì)“未來人工智能先鋒論壇”上,清華大學(xué)人工智能研究院副院長(zhǎng)、生數(shù)科技創(chuàng)始人兼首席科學(xué)家朱軍發(fā)布了高可控視頻大模型Vidu Q1,標(biāo)志著國(guó)產(chǎn)視頻大模型邁向了新高度。
“一輛越野車行駛在森林中,陽(yáng)光透過樹葉的縫隙,形成一道道斑駁的光束……”這段由國(guó)產(chǎn)AI視頻大模型生成的模擬真實(shí)物理世界的高清視頻,在2024中關(guān)村論壇年會(huì)首次驚艷亮相。彼時(shí),生數(shù)科技聯(lián)合清華大學(xué)發(fā)布的中國(guó)首個(gè)全面對(duì)標(biāo)Sora的視頻大模型Vidu引發(fā)全球關(guān)注。
一年后,朱軍再次來到中關(guān)村論壇年會(huì)的演講臺(tái)上,帶來了團(tuán)隊(duì)的最新成果——Vidu Q1模型。基于該模型,人們不僅用一句話就能生成一段精美的AI視頻,還能對(duì)視頻中各種主體的位置、大小、運(yùn)動(dòng)軌跡進(jìn)行精準(zhǔn)的控制和調(diào)整。
據(jù)悉,一直以來,AI視頻生成過程中的隨機(jī)性都是老大難問題,Vidu Q1針對(duì)AI視頻生成的痛點(diǎn),通過技術(shù)手段引入多元素控制,它不再是沒有頭緒的亂生成,而是做到了人為可控,這就讓AI視頻生成與當(dāng)下精益求精制作逐漸趨向一致,對(duì)于追求極致的人來說,這是一個(gè)新的里程碑。
“期待中國(guó)的AI視頻生成賽道玩家能夠持續(xù)在世界舞臺(tái)上舞出風(fēng)采,在百家爭(zhēng)鳴中,實(shí)現(xiàn)中國(guó)多模態(tài)技術(shù)的極大發(fā)展和人人可感知到的現(xiàn)實(shí)應(yīng)用。讓我們一起期待中國(guó)隊(duì)的表現(xiàn)。”朱軍說。
據(jù)悉,AI視頻生成模型已經(jīng)在動(dòng)漫、影視等領(lǐng)域落地。以動(dòng)漫領(lǐng)域?yàn)槔ㄟ^對(duì)角色、物體、場(chǎng)景等的精確控制,能夠讓創(chuàng)作者快速生成高質(zhì)量動(dòng)畫。日前好萊塢知名動(dòng)漫工作室Aura Productions選擇與Vidu合作,計(jì)劃制作50集動(dòng)畫短劇。
編輯:李華山