編者按:奮進的中國再度點燃激情與夢想的圣火,世界翹首以待的北京冬奧會將于2022年2月4日開幕。
數(shù)次聯(lián)系左家平,她都在忙。
“我們一直在北京廣播電視臺做技術(shù)方面的溝通對接,估計到今年1月底才能圓滿完成。”左家平回復(fù)說。
左家平是智譜AI公司的高級副總裁。作為課題組成員,左家平和中國計算機學(xué)會中文信息技術(shù)專業(yè)委員會副主任、清華大學(xué)教授、北京智源人工智能研究院副院長唐杰等人一起,研發(fā)了“手語播報數(shù)字人”系統(tǒng)。
基于該手語播報數(shù)字人,北京2022年冬奧會、冬殘奧會舉行時,聽障人士將享受基于人工智能(AI)技術(shù)的精準(zhǔn)手語播報服務(wù)。
“這個手語播報數(shù)字人將應(yīng)用于北京2022年冬奧會、冬殘奧會的賽事報道場景中,提供全流程智能化的數(shù)字人手語生成服務(wù),用手語根據(jù)文字自動播報相關(guān)信息。”唐杰表示。
作為構(gòu)建未來虛擬世界諸多應(yīng)用的主干,如何創(chuàng)造栩栩如生的虛擬數(shù)字人,一直是計算機視覺、計算機圖形學(xué)與多媒體等AI相關(guān)學(xué)科密切關(guān)注的重要研究課題。
“手語播報數(shù)字人能夠方便聽障人士收看賽事專題報道,提升他們的社會參與度和幸福感。”唐杰說。
事實上,手語播報數(shù)字人的研發(fā)離不開超大規(guī)模人工智能預(yù)訓(xùn)練模型的支持。這個手語播報數(shù)字人基于“悟道2.0”大模型開發(fā),由“科技冬奧”專項支持,智譜AI、凌云光和北京廣播電視臺聯(lián)合打造。
賦予手語播報數(shù)字人、科普機器人理解和表達知識的能力,是研發(fā)的難點。項目團隊成員、清華大學(xué)計算機系博士生于濟凡表示,科普機器人目前已經(jīng)學(xué)習(xí)了百萬級別的知識圖譜,也接入了超大規(guī)模的中文預(yù)訓(xùn)練模型,相比很多其他智能問答類產(chǎn)品,進一步減少了人工規(guī)則,加強了智能學(xué)習(xí)和提升能力。
而讓手語播報數(shù)字人這樣一款創(chuàng)新產(chǎn)品真正應(yīng)用于賽事報道中,也并非易事。“需要不斷與電視臺方面去溝通,進行技術(shù)調(diào)試,讓手語播報數(shù)字人真正解決聽障人士收看冬奧賽事的問題。”左家平說。
在工程實現(xiàn)上,團隊也做了大量創(chuàng)新。項目團隊成員、智譜AI工程師譚棋洋表示,為了增加機器人對人工智能模型的兼容性,并為機器人定制合適的動作,讓它能在不同的場景用更準(zhǔn)確合理的姿勢增加交流的親密性和表達的準(zhǔn)確性,團隊重構(gòu)了機器人底層的交互邏輯。
“手語主要靠手勢來傳遞信息,由于不同的人有不同的手勢習(xí)慣,容易造成信息傳遞偏差。”唐杰介紹,人工智能可避免“千人千面”,始終保持統(tǒng)一。手語播報機器人能提供全流程智能化的精確播報服務(wù),方便聽障人士收看賽事專題報道。
“隨著人工智能變得越來越聰明,在老年人和兒童陪伴、規(guī)劃出行、娛樂等生活的各個方面,其發(fā)揮的作用會越來越大。”唐杰說。
編輯:李華山