行人再識(shí)別:平安城市添利器
來(lái)源:中國(guó)科學(xué)報(bào) 2016-8-29 甘曉
行人再識(shí)別(Person Re-identification),是近幾年智能視頻分析領(lǐng)域興起的一項(xiàng)新技術(shù),主要用于公共安全視頻監(jiān)控中的人像識(shí)別。鑒于不同視頻監(jiān)控下環(huán)境的復(fù)雜性,研究者們一直致力于提高識(shí)別的準(zhǔn)確率和檢索效率。
最近,在國(guó)家自然科學(xué)基金(項(xiàng)目資助號(hào):61071135)等項(xiàng)目的資助下,清華大學(xué)電子工程系教授王生進(jìn)帶領(lǐng)課題組在該領(lǐng)域取得了新進(jìn)展。在兩個(gè)典型行人序列數(shù)據(jù)集上,他們開(kāi)發(fā)的新方法準(zhǔn)確率分別比現(xiàn)有最好方法提高了5.7%和16.3%,在平安城市視頻監(jiān)控應(yīng)用領(lǐng)域具有良好潛力。日前,國(guó)際權(quán)威期刊IEEE PAMI發(fā)表了這項(xiàng)成果。
解決視頻監(jiān)控中的難題
當(dāng)公安部門(mén)追蹤嫌疑人時(shí),遍布在城市大街小巷的視頻監(jiān)控就派上了用場(chǎng)。不過(guò),在視頻監(jiān)控中,一個(gè)攝像頭往往無(wú)法覆蓋所有區(qū)域,而多攝像頭視野又沒(méi)有重疊,導(dǎo)致追蹤目標(biāo)人的軌跡出現(xiàn)很大困難。
王生進(jìn)告訴《中國(guó)科學(xué)報(bào)》記者:“在識(shí)別同一個(gè)目標(biāo)時(shí),視角、尺度、光照、服飾多樣性、姿態(tài)多變性、分辨率不同以及部分遮擋,不同攝像頭間失去連續(xù)的位置和運(yùn)動(dòng)信息,會(huì)影響目標(biāo)的快速檢索。”例如,視角變化會(huì)帶來(lái)場(chǎng)景中的物體與攝像頭光軸呈現(xiàn)不同的夾角,導(dǎo)致二維圖像中物體表象存在差異;而尺度變化則會(huì)導(dǎo)致不同目標(biāo)在圖像中所占圖像區(qū)域的差異,要求算法對(duì)尺度具有一定魯棒性,特征提取就會(huì)變得困難。
這在專(zhuān)業(yè)領(lǐng)域內(nèi)被稱(chēng)為“跨視閾重現(xiàn)目標(biāo)識(shí)別”。從目前的研究情況來(lái)看,這是一個(gè)極具挑戰(zhàn)性的問(wèn)題。
從前,遇到這種情況,公安部門(mén)只能用肉眼仔細(xì)辨認(rèn),這對(duì)偵破工作帶來(lái)了障礙。“行人再識(shí)別”技術(shù)便是基于這樣的現(xiàn)實(shí)需求發(fā)展起來(lái)。
創(chuàng)新表觀與步態(tài)融合的識(shí)別方法
多年來(lái),科學(xué)家一致致力于開(kāi)發(fā)基于圖像的“行人再識(shí)別”技術(shù)。
王生進(jìn)介紹,基于圖像的“行人再識(shí)別”本質(zhì)是圖像的描述與匹配,表觀特征的提取和度量學(xué)習(xí)是其兩個(gè)核心問(wèn)題。“包括衣服顏色、紋理、邊緣、形狀等表觀特征是區(qū)分不同人的最主要特征。”他說(shuō)。度量學(xué)習(xí)則意味著識(shí)別系統(tǒng)通過(guò)深度學(xué)習(xí)獲得不同攝像頭之間亮度、顏色等關(guān)鍵信息的轉(zhuǎn)移函數(shù)。
2009年起,王生進(jìn)帶領(lǐng)課題組開(kāi)始將行人再識(shí)別作為重點(diǎn)研究課題,近兩年又與步態(tài)和圖像檢索(Image Search)結(jié)合在一起,獲得了性能領(lǐng)先的實(shí)驗(yàn)結(jié)果,并構(gòu)建了一個(gè)迄今為止本研究領(lǐng)域最大的具有時(shí)空信息的行人再識(shí)別數(shù)據(jù)集iLIDS-VID,實(shí)現(xiàn)了快速準(zhǔn)確的行人再識(shí)別系統(tǒng)。至2016年初,他們所構(gòu)建的具有時(shí)空信息的行人再識(shí)別數(shù)據(jù)庫(kù),下載量已達(dá)3700次,在國(guó)際學(xué)術(shù)界具有一定的影響。
王生進(jìn)表示,在這項(xiàng)研究成果中,他們提出了一種基于步態(tài)時(shí)空特征融合的選擇排序模型,用于在實(shí)際應(yīng)用場(chǎng)景中利用行走行為進(jìn)行人的身份識(shí)別。
“該模型將人體圖像序列表示為視頻片段集合,基于視頻片段的像素?cái)?shù)據(jù)計(jì)算反映步態(tài)信息的時(shí)空特征,從視頻片段集合中自動(dòng)選擇步態(tài)鑒別力豐富的視頻片段用于訓(xùn)練步態(tài)排序模型。”王生進(jìn)說(shuō)。
結(jié)果表明,這一方法使行人識(shí)別準(zhǔn)確率分別比現(xiàn)有最好方法提高了5.7%和16.3%。
受科學(xué)基金認(rèn)可
王生進(jìn)自2003年10月回國(guó)后,便來(lái)到清華大學(xué)任教,一直從事計(jì)算機(jī)視覺(jué)和視頻圖像模式識(shí)別、多媒體信息處理領(lǐng)域的研究。
“公共安全領(lǐng)域是我們研究成果的重點(diǎn)應(yīng)用方向。”王生進(jìn)表示。
2009年,行人再識(shí)別技術(shù)在國(guó)際上剛剛起步。王生進(jìn)就以“重現(xiàn)的行人目標(biāo)數(shù)據(jù)關(guān)聯(lián)和深度跟蹤理論及方法研究”為題,申請(qǐng)了國(guó)家自然科學(xué)基金。“當(dāng)時(shí),不光研究寥寥無(wú)幾,”他回憶,“連概念都提得很少。”
考慮到自然科學(xué)基金重在資助基礎(chǔ)科學(xué)研究,他們?cè)谏暾?qǐng)書(shū)中提出了這一領(lǐng)域的諸多基礎(chǔ)科學(xué)問(wèn)題。一年后,王生進(jìn)順利拿到了科學(xué)基金的資助。對(duì)他而言,一方面是資金上的支持,更大的意義在于得到了國(guó)家基金委極大的鼓勵(lì)。
“獲得科學(xué)基金的資助,意味著專(zhuān)家認(rèn)為我們研究的方向夠前沿、有價(jià)值,行人再識(shí)別這個(gè)方向得到了承認(rèn)。”王生進(jìn)說(shuō)。
如今,他們不僅解決了諸多基礎(chǔ)科學(xué)問(wèn)題,也將自己的研究推向了應(yīng)用。據(jù)記者了解,上述最新研究成果已經(jīng)被公安部門(mén)應(yīng)用在新疆地區(qū)平安城市視頻監(jiān)控中。
對(duì)此,王生進(jìn)感到非常欣慰。“科研應(yīng)當(dāng)‘頂天立地’,既要在基礎(chǔ)研究方面與世界同步,也要能運(yùn)用到實(shí)際生活中。”他期待,行人再識(shí)別研究在公共安全領(lǐng)域有更大的應(yīng)用前景。
編輯:苑苑