近期,通過人工智能大模型賦能影像創(chuàng)作,多部AI短片陸續(xù)面世,受到各界關(guān)注。作為一項(xiàng)重要技術(shù),人工智能大模型推動(dòng)影視行業(yè)從膠片成像、數(shù)字成像進(jìn)入算法成像時(shí)代,大幅提升影像生產(chǎn)效能。很多讀者想了解,新技術(shù)具體怎樣改變影像制作流程,將給影視行業(yè)帶來怎樣的變革,“投進(jìn)一部小說,還你一部電影”的愿景會(huì)實(shí)現(xiàn)嗎?我們約請(qǐng)一線創(chuàng)作者和研究者撰文,分享創(chuàng)作體會(huì)和前沿觀察。
——編 者
人工智能再造視聽內(nèi)容創(chuàng)作流程
“所思即所見,所見即所想”,將心中所想直接轉(zhuǎn)化為眼前可見的內(nèi)容是人類孜孜以求的夢(mèng)想。作為AI微短劇《中國神話》創(chuàng)作者,我們?nèi)诤衔纳摹⑽纳鷪D、文生音樂和文生視頻等人工智能技術(shù),實(shí)現(xiàn)了從創(chuàng)意構(gòu)思到視聽呈現(xiàn)的人工智能全流程再造,探索人類與機(jī)器智能合作的新模式。
智能化策劃,讓人工智能成為創(chuàng)意策劃的“智囊團(tuán)”。故事策劃是視聽內(nèi)容創(chuàng)作的首要環(huán)節(jié),傳統(tǒng)編劇的靈感往往受限于個(gè)人閱歷和知識(shí)結(jié)構(gòu),而大語言模型因?yàn)閷W(xué)習(xí)了萬億數(shù)量級(jí)的文字內(nèi)容,相比于個(gè)體創(chuàng)作者,對(duì)古今中外的“人情世故”更為了解,有推理能力的人工智能還會(huì)組合創(chuàng)新,因而成為故事腳本撰寫的好幫手。利用人工智能工具,可以高效完成劇本方案、人物設(shè)定、作品世界觀架構(gòu)等工作。以《中國神話》的創(chuàng)作為例,創(chuàng)作團(tuán)隊(duì)利用智能應(yīng)用對(duì)中國古代神話資料進(jìn)行智能檢索、關(guān)聯(lián)分析,快速梳理出角色譜系、情節(jié)脈絡(luò)等關(guān)鍵信息,在此基礎(chǔ)上生成數(shù)十個(gè)走向的故事候選方案,分集故事框架的搭建過程僅需20分鐘,前期策劃的人力投入減少70%左右。事實(shí)上,在清華大學(xué)團(tuán)隊(duì)近期創(chuàng)作的200余條AI視頻中,人工智能輔助生成的選題方案已涵蓋文史、科技、美食、旅行、教育等多個(gè)垂直領(lǐng)域,人工智能幫助策劃者快速獲取靈感、系統(tǒng)化拓展思路,為視聽內(nèi)容策劃與制作的“想什么”賦能。
自動(dòng)化生產(chǎn),用人工智能豐富“怎么拍”的路徑。在影視畫面制作階段,人工智能技術(shù)的引入帶來流程再造。我們采用文生圖、文生視頻技術(shù),通過輸入文字指令讓人工智能自動(dòng)生成相應(yīng)風(fēng)格的圖片素材與視頻素材,極大簡化了視覺創(chuàng)意從構(gòu)思到呈現(xiàn)的流程。這其中的關(guān)鍵技術(shù)在于將自然語言文本與視覺內(nèi)容建立精準(zhǔn)映射,利用大規(guī)模多模態(tài)預(yù)訓(xùn)練模型,實(shí)現(xiàn)圖片和視頻內(nèi)容的智能生成。這一技術(shù)打破了傳統(tǒng)動(dòng)畫影視制作中分鏡繪制、三維建模、動(dòng)作捕捉等環(huán)節(jié)對(duì)專業(yè)技術(shù)的高度依賴,把傳統(tǒng)視聽創(chuàng)作對(duì)“心—目—手”的高要求轉(zhuǎn)換為“心—目—言”的新要求,實(shí)現(xiàn)了從文字腳本到視覺畫面的直接轉(zhuǎn)化,使影視創(chuàng)意的呈現(xiàn)更加高效靈活。這是視聽內(nèi)容創(chuàng)作的一次重大范式轉(zhuǎn)變。由于語料豐富,人工智能可以快捷制作出包括寫實(shí)、抽象等在內(nèi)的近130種不同藝術(shù)風(fēng)格的影像內(nèi)容,拓展了視覺創(chuàng)意的可能性,為視聽內(nèi)容創(chuàng)作提供更多靈感。
智能配音和剪輯,以人工智能替代大量基礎(chǔ)性工作。音樂是視聽作品的情感載體,對(duì)渲染氣氛、引發(fā)共鳴起著關(guān)鍵作用。我們調(diào)用人工智能工具,對(duì)短劇的故事情節(jié)、畫面節(jié)奏、情緒基調(diào)進(jìn)行分析并提取關(guān)鍵信息點(diǎn);再將文本信息輸入音樂模型,使其實(shí)時(shí)輸出與影片風(fēng)格、情感氛圍相匹配的音樂素材;最后再通過人工優(yōu)選與整合潤色,配制出風(fēng)格一致、節(jié)奏流暢的影片配樂。文生音樂的創(chuàng)作模式實(shí)現(xiàn)了人工作曲到智能生成的轉(zhuǎn)變,大幅提升了創(chuàng)作效率,降低了生產(chǎn)成本。
配音是視聽作品的重要組成,對(duì)角色塑造、情感表達(dá)都起到不容忽視的作用。人工智能語音合成技術(shù)可自動(dòng)匹配對(duì)白語氣,再現(xiàn)角色的音色特點(diǎn)與情感狀態(tài)。基于深度學(xué)習(xí)的人工智能配音系統(tǒng)還可捕捉真人配音的韻律特點(diǎn)與情感變化,生成更加接近真人的配音效果。目前,我們利用人工智能技術(shù),可實(shí)現(xiàn)配音流程的全自動(dòng)化。
后期制作向來是影視制作中耗時(shí)耗力的環(huán)節(jié),我們?cè)谝曨l剪輯時(shí)采用智能鏡頭分類、自動(dòng)拆條、片段標(biāo)引、智能字幕、一鍵調(diào)色等方法,可讓人工智能“剪刀手”代勞80%的粗剪工作。6分鐘時(shí)長的影片粗剪僅需20分鐘,是傳統(tǒng)手工剪輯速度的5倍。整個(gè)視頻全部交付的綜合人力時(shí)間成本是傳統(tǒng)制作流程的1/16左右。在人工智能代勞大量基礎(chǔ)性工作后,人類創(chuàng)作者能夠?qū)⒏嗑ν度雽?duì)作品的宏觀調(diào)度與藝術(shù)把控上,并對(duì)內(nèi)容進(jìn)行選擇和優(yōu)化。
整體而言,人工智能技術(shù)將成為提升視聽內(nèi)容生產(chǎn)力的重要工具,人工智能與人類智慧的交織融合正在重塑視聽藝術(shù)的邊界。未來,合成視頻、對(duì)話和交互式視頻、無編輯視頻、跨風(fēng)格視頻等新類型內(nèi)容,將極大豐富視聽產(chǎn)品的品類和形態(tài),提升內(nèi)容的個(gè)性化水平,提高內(nèi)容制作的實(shí)時(shí)性。同時(shí),新的創(chuàng)作生產(chǎn)方式也對(duì)創(chuàng)作者的角色定位和知識(shí)結(jié)構(gòu)提出了新的要求,審美和想象力將變得更加重要。當(dāng)然,人工智能也會(huì)犯錯(cuò),輸出無中生有的內(nèi)容,帶來穿幫鏡頭等問題,隨著技術(shù)的發(fā)展,這些問題將逐步得到解決。
當(dāng)人工智能技術(shù)進(jìn)一步成熟之后,視聽內(nèi)容創(chuàng)作效率將提升百倍千倍。人類提供一個(gè)初始想法,人工智能就能創(chuàng)作出一部中短篇小說,根據(jù)這部小說又能創(chuàng)作出一部影片,整個(gè)過程也許只需要數(shù)分鐘即可完成,這種前所未有的視聽創(chuàng)作的夢(mèng)幻場(chǎng)景,有很大概率在不久的將來實(shí)現(xiàn)。屆時(shí),只要輸入創(chuàng)作訴求甚至輸出腦電波,人們就可進(jìn)行多模態(tài)優(yōu)質(zhì)內(nèi)容創(chuàng)作,在人工智能協(xié)助下實(shí)現(xiàn)藝術(shù)表達(dá)。《中國神話》等作品只是一個(gè)起點(diǎn),人工智能賦能文藝創(chuàng)作的更多可能性,正等待著我們?nèi)ヌ剿骱蛯?shí)現(xiàn)。
(作者為清華大學(xué)新聞與傳播學(xué)院教授)
編輯:李華山