清華交叉信息院唐平中研究組提出全新算法
有望解決電商平臺(tái)刷單欺詐問題
清華新聞網(wǎng)9月29日電 清華大學(xué)交叉信息研究院唐平中助理教授研究組與阿里巴巴公司合作,針對(duì)評(píng)價(jià)系統(tǒng)(Reputation System)普遍存在的商家刷單提升信用問題提出了基于博弈論與優(yōu)化的新解決方案,并在淘寶網(wǎng)和天貓的數(shù)據(jù)集上取得了滿意的仿真實(shí)驗(yàn)結(jié)果。該研究成果《面向個(gè)性化推薦系統(tǒng)的機(jī)制設(shè)計(jì)》(Mechanism Design for Personalized Recommender Systems)近期以長文形式發(fā)表于美國計(jì)算機(jī)協(xié)會(huì)推薦系統(tǒng)年會(huì)(ACM RecSys 2016)。
推薦系統(tǒng)根據(jù)買家的購買點(diǎn)擊數(shù)據(jù)和商品的評(píng)價(jià)(Reputation System)進(jìn)行推薦,得分高的賣家獲得更多的買家訪問量,這促使賣家通過提升自己的服務(wù)和商品質(zhì)量,從而提升購買數(shù)量。對(duì)于賣家來說,良好信譽(yù)是建立于長期累積和穩(wěn)定經(jīng)營。但是,為獲得更多的買家訪問量,部分賣家會(huì)采用刷單、炒信的捷徑提高信譽(yù)度,不僅嚴(yán)重影響了買家在推薦系統(tǒng)上的用戶體驗(yàn),也影響了不刷單的賣家的利益。刷單的現(xiàn)象如今非常普遍,甚至已形成了一個(gè)地下產(chǎn)業(yè)。
現(xiàn)有的防止辦法大多采用機(jī)器學(xué)習(xí)的方式,即對(duì)商品的評(píng)價(jià)文本抽取特征,同時(shí)進(jìn)行人工標(biāo)定是否為虛假評(píng)價(jià)的標(biāo)記訓(xùn)練模型。 但對(duì)于很多評(píng)論來說,人工標(biāo)記也十分困難,因此這些模型有可能會(huì)誤傷誠信的賣家。
針對(duì)這個(gè)問題,唐平中研究組從博弈論和機(jī)制設(shè)計(jì)的角度,提出了一個(gè)全新的防止刷單的理論模型和相應(yīng)的實(shí)現(xiàn)算法。在這個(gè)模型中,推薦的流量分配被建模成一個(gè)可分割資源的問題,賣家參與刷單的成本大于刷單得到流量提升帶來的收益,因而賣家不會(huì)選擇刷單。之后對(duì)阿里巴巴提供的購買數(shù)據(jù)進(jìn)行分析處理,模擬論文中提出的機(jī)制,發(fā)現(xiàn)機(jī)制帶來的總成交量優(yōu)于淘寶現(xiàn)有的推薦算法。下圖為模擬實(shí)驗(yàn)的結(jié)果:

該成果具有一定的普適性,可應(yīng)用于基于推薦的互聯(lián)網(wǎng)場景,如亞馬遜、阿里巴巴、京東、美團(tuán)等企業(yè),具有很高的應(yīng)用前景和商業(yè)價(jià)值。
ACM推薦系統(tǒng)年會(huì)是美國計(jì)算機(jī)協(xié)會(huì)(ACM)舉辦的推薦系統(tǒng)頂級(jí)會(huì)議,本次會(huì)議的長文錄用率約為10%。作者按英文字母順序排序,第一作者為蔡慶芃,通訊作者為唐平中。
此項(xiàng)研究得到了國家自然基金和清華大學(xué)自主科研計(jì)劃的資助。
論文鏈接:
http://dl.acm.org/citation.cfm?id=2959135
供稿:交叉信息學(xué)院 編輯:李華山