印奇:85后極客創(chuàng)造“刷臉”時(shí)代
來源:文匯報(bào) 2015-5-29
不久以后,我們上網(wǎng)購物結(jié)算只要對(duì)著攝像頭“刷臉”;在人臉識(shí)別的基礎(chǔ)上,每個(gè)人都將擁有互聯(lián)網(wǎng)時(shí)代的新賬號(hào)體系,以幫助我們解決身份識(shí)別的問題。那時(shí)候想“證明你媽是你媽”、“你是你”這樣看似荒謬的問題,也會(huì)輕而易舉。
從人臉識(shí)別到圖像識(shí)別,乃至“所見即所得”的機(jī)器之眼,是畢業(yè)于清華大學(xué)的3位85后極客——印奇、唐文斌和楊沐努力想要實(shí)現(xiàn)的場(chǎng)景。2011年,他們?cè)谇迦A園里創(chuàng)立Megvii,至今一直專注于圖像識(shí)別和深度學(xué)習(xí)領(lǐng)域。印奇告訴記者,“每個(gè)極客都有一個(gè)‘科技改變世界’的夢(mèng)想。更幸運(yùn)的是我們追夢(mèng)的方向恰好趕上了一個(gè)很大的風(fēng)口。”
三位清華學(xué)霸聯(lián)手創(chuàng)業(yè)
在清華大學(xué)培養(yǎng)計(jì)算機(jī)技術(shù)精英的姚期智實(shí)驗(yàn)班,印奇、唐文斌和楊沐是三個(gè)標(biāo)準(zhǔn)的“極客”。唐文斌從初中起就參加信息學(xué)編程比賽,先后多次獲得ACM、CodeJam等各類編程比賽冠軍,并擔(dān)任國家信息學(xué)競(jìng)賽總教練7年之久。楊沐比印奇和唐文斌低一級(jí),也曾斬獲國際信息編程奧林匹克比賽金牌。三人各有所長(zhǎng),唐文斌專攻圖像搜索,印奇擅于視覺識(shí)別,楊沐則以數(shù)據(jù)挖掘見長(zhǎng)。從大二開始,印奇就在微軟亞洲研究院實(shí)習(xí),參與人臉識(shí)別引擎的研發(fā)。“那時(shí)候,我對(duì)人臉識(shí)別技術(shù)就很著迷,畢業(yè)后還全職工作了一年,參與研發(fā)的引擎后來被應(yīng)用在X-box和Bing等微軟產(chǎn)品中。”印奇回憶道,“那時(shí)候我就確定,要在這個(gè)領(lǐng)域做點(diǎn)啥。”
2011年,一部iphone,讓唐文斌和印奇走上創(chuàng)造之旅。iphone有前置攝像頭,憑借兩個(gè)人在視覺技術(shù)方面的積累,唐文斌在宿舍里約上印奇一起研發(fā)出名為《烏鴉來了》(CrowsComing)的體感游戲——玩家通過搖晃頭部控制游戲里的稻草人,攔截從天而降偷食莊稼的烏鴉。這款小游戲一度沖上AppStore排行榜的前5名,還獲得了清華大學(xué)第三十屆“挑戰(zhàn)杯”特等獎(jiǎng)。
彼時(shí),聯(lián)想之星投資負(fù)責(zé)人關(guān)注到了印奇的團(tuán)隊(duì),“一個(gè)聽上去很傳統(tǒng)的領(lǐng)域,隨著移動(dòng)設(shè)備、云端計(jì)算能力的普及和識(shí)別算法的大突破,開始真正進(jìn)入了臨爆點(diǎn)。過不了幾年,人臉登錄、人臉?biāo)阉鞫紝⒊蔀楝F(xiàn)實(shí),屆時(shí)人臉將是最自然、信息量最大的入口。有著廣闊的應(yīng)用場(chǎng)景。”這讓印奇激動(dòng)無比,投資者的到來,使他更加認(rèn)定視覺識(shí)別技術(shù)必將迎來爆發(fā)。
數(shù)據(jù)!除了數(shù)據(jù)還是數(shù)據(jù)!
2011年10月,曠視科技正式成立。
印奇為公司制定了明確的“三步走”發(fā)展策略,即先搭建Face++的人臉識(shí)別云服務(wù)平臺(tái),目標(biāo)是識(shí)人;第二步則是Image++,識(shí)別萬物;最后則是實(shí)現(xiàn)“所見即所得”的機(jī)器之眼。
印奇解釋說,從人臉識(shí)別入手,是因?yàn)檫@是目前被使用最廣、也是最便捷的識(shí)別方式。“每個(gè)人的面部圖像在國家權(quán)威數(shù)據(jù)庫中都有相應(yīng)的數(shù)據(jù),是唯一可以被商業(yè)化運(yùn)用的生物驗(yàn)證體系。”
2012年,公司首款核心產(chǎn)品Face++1.0版本上線,并不斷快速迭代。印奇將這打造為一個(gè)開放的平臺(tái),上萬個(gè)開發(fā)者在整個(gè)平臺(tái)上享受免費(fèi)服務(wù),并為平臺(tái)提供200多萬張圖片。在不作商用的前提下,F(xiàn)ace++借用這些圖片及其標(biāo)注信息進(jìn)行算法學(xué)習(xí),基于上述數(shù)據(jù)和技術(shù)的積累,在更加顯性的層面,F(xiàn)ace++也開始嘗試一些應(yīng)用的制作。
如今,F(xiàn)ace++平臺(tái)圖庫數(shù)量超越10億級(jí),有1.5萬個(gè)APP與其合作。平臺(tái)上活躍的開發(fā)者超過2.4萬人,阿里、美圖、世紀(jì)佳緣等一批圖片、社交類企業(yè)都與平臺(tái)建立合作關(guān)系,這使Face++成為使用量很大的人臉識(shí)別引擎。
印奇將人臉識(shí)別用到的深度算法,比喻為“嬰兒智力的黑盒”,那是一套模擬人腦神經(jīng)網(wǎng)絡(luò)的算法。這套算法對(duì)于計(jì)算平臺(tái)的底層架構(gòu)要求很高。在這項(xiàng)技術(shù)上,Google、Facebook、百度等互聯(lián)網(wǎng)巨頭水平很接近。而出奇制勝的法寶,就在于海量的數(shù)據(jù)以及優(yōu)化算法。
讓印奇印象最深的是,李開復(fù)一直特別強(qiáng)調(diào)數(shù)據(jù)循環(huán)的重要性,“如果有兩個(gè)客戶,一個(gè)客戶可以給你一年100萬元資金,還有一個(gè)可以給你一年貢獻(xiàn)1000萬的數(shù)據(jù),一定要數(shù)據(jù)!”
人臉識(shí)別大致可分為人臉檢測(cè)、人臉關(guān)鍵點(diǎn)定位和人臉識(shí)別三個(gè)大項(xiàng)。2014年,F(xiàn)ace++連續(xù)收獲FDDB、300-W、LFW三項(xiàng)國際評(píng)測(cè)的冠軍,尤其在互聯(lián)網(wǎng)新聞圖片的人臉識(shí)別評(píng)測(cè)中,以97.27%的準(zhǔn)確率力壓之前業(yè)內(nèi)第一的Facebook人臉團(tuán)隊(duì)。
創(chuàng)業(yè)是個(gè)“看兩端”的過程
聯(lián)系到印奇時(shí),他正在杭州湖畔大學(xué)進(jìn)修。“能讓我來這的原因只有一個(gè),就是馬云。”在印奇看來,創(chuàng)業(yè)必須是一個(gè)“看兩端”的過程。創(chuàng)業(yè)之初,必須有用技術(shù)改變世界的執(zhí)著和使命感,才能刨除功利性的心理,好好做一個(gè)產(chǎn)品;但是,能讓企業(yè)走得長(zhǎng)遠(yuǎn)的,往往是“木桶理論”——最短的那塊木板決定了木桶的容量。因此,在創(chuàng)業(yè)過程中,印奇從未放棄學(xué)習(xí)。
創(chuàng)業(yè)之初,三位清華極客雖然精通云上核心算法,但機(jī)器識(shí)別包含云、端兩部分,“端”這部分硬件技術(shù),成了曠視科技的“短板”。“對(duì)圖像識(shí)別而言,如果不能處理好前端的圖像采集,即使核心算法再好,最終的效果也不會(huì)好。”為此,印奇前往哥倫比亞大學(xué)進(jìn)修兩年,師從Computational Camera的行業(yè)泰斗,專攻3D相機(jī)方向的博士學(xué)位。
印奇執(zhí)著地認(rèn)為,一個(gè)最優(yōu)質(zhì)的創(chuàng)業(yè)團(tuán)隊(duì),是保證創(chuàng)業(yè)成功最關(guān)鍵的因素。8成員工都以定向挖掘和內(nèi)推的方式招募。這也是天使投資人看中曠視科技的原因之一,三位創(chuàng)始人的能力不言而喻。而整個(gè)Face++團(tuán)隊(duì),有20名全職員工和20位來自清華的實(shí)習(xí)生相互協(xié)作,他們當(dāng)中的6人斬獲國際奧林匹克信息學(xué)金牌,1人獲得過國際奧林匹克物理學(xué)金牌。
讓一群“聰明極了”的人一起工作,印奇自有管理的妙招——給員工更多自由的空間。只要目標(biāo)明確,這群聰明人的自我驅(qū)動(dòng)力都很強(qiáng),何必管到頭發(fā)絲呢?
加速產(chǎn)品化,實(shí)現(xiàn)滾雪球效應(yīng)
將人臉識(shí)別技術(shù)應(yīng)用于更加廣闊的領(lǐng)域,加快商業(yè)化步伐,是印奇最近思考的重點(diǎn)。目前,F(xiàn)ace++的技術(shù)已經(jīng)相對(duì)成熟,亟待進(jìn)入商業(yè)化的階段。
目前,Megvii已經(jīng)完成B輪4700萬美金的融資后,曠視科技(Megvii)開始發(fā)力互聯(lián)網(wǎng)市場(chǎng)以外的兩個(gè)重要領(lǐng)域——“金融行業(yè)的人臉認(rèn)證”與智能監(jiān)控、智能家居應(yīng)用。在金融領(lǐng)域,人臉識(shí)別核心問題是要解決線上面簽,F(xiàn)ace++與螞蟻金服以及商業(yè)銀行展開合作。印奇透露,Megvii的Face++平臺(tái)單獨(dú)為金融場(chǎng)景做出符合識(shí)別標(biāo)準(zhǔn)的Face++Financial解決方案。“這一動(dòng)態(tài)人臉認(rèn)證過程,可以規(guī)避來自圖片或錄像的攻擊,在電腦或手機(jī)上的前置攝像頭前,用戶只要根據(jù)頁面指令,做出一連串連續(xù)的簡(jiǎn)單動(dòng)作,比如搖搖頭、眨眨眼睛、動(dòng)動(dòng)嘴巴、微笑,數(shù)據(jù)被發(fā)送到云端后與公安部的備份照片進(jìn)行匹配,匹配成功表示是本人開戶,否則就拒絕開戶。”
智能迎賓系統(tǒng)是曠視科技系統(tǒng)集成的一套完整硬件產(chǎn)品,其核心邏輯是一套動(dòng)態(tài)人臉識(shí)別系統(tǒng)。印奇說,“2015年,產(chǎn)品化進(jìn)程我們已經(jīng)走在前端。判斷領(lǐng)域內(nèi)能否發(fā)生本質(zhì)性的變革和顛覆性的技術(shù)創(chuàng)新,也許像我們這樣的初創(chuàng)公司更能實(shí)現(xiàn)彎道超車。”