據(jù)合肥晚報報道,如何從“茫茫人海”中識別出小偷?科大校友們想到了一種辦法——大數(shù)據(jù)抓小偷。
昨天,記者從中科大新創(chuàng)校友基金會獲悉,科大校友羅格斯大學教授熊輝介紹了一種方法,他們通過分析智能公交一卡通數(shù)據(jù),研究北京公交、地鐵上乘客的出行規(guī)律,從而識別扒手。該研究成功地識別出了92.7%的小偷。
根據(jù)異常交通記錄分析抓小偷
大數(shù)據(jù)時代的到來,使得每個人都已經(jīng)被數(shù)字化,也就是說,人們的生產和生活的活動都被數(shù)字化、網(wǎng)絡化、可計算化。這也使得利用智能學習的計算模型,來對人的行為進行預測,對人的情感,包括性格、感情和犯罪心理等進行分析成為可能。
日前,在舊金山舉行的KDD2016學術會議(知識發(fā)現(xiàn)和數(shù)據(jù)挖掘大會)上,科大校友羅格斯大學熊輝等學者報告了研究論文:他們對北京智能公交一卡通數(shù)據(jù)的分析研究,根據(jù)異常交通記錄分析來抓小偷。共使用了北京市2014年4—6月三個月間600萬乘客,約16億智能公交一卡通數(shù)據(jù)記錄。熊輝等研究人員將北京劃分為多個小的局部的功能區(qū)塊,并分析了896條地鐵線經(jīng)過的44524個公交車站、18條地鐵線經(jīng)過的320個地鐵站的數(shù)據(jù)。
研究人員首先從每個人的日常出現(xiàn)記錄中提取特征;然后進行無監(jiān)督的異常行人檢測和有監(jiān)督的模式分類,從而挖掘出異常的出行軌跡。
能正確識別九成以上小偷
在談到“根據(jù)異常交通記錄分析抓小偷”方法的基本原理時,熊輝進一步解釋,通過數(shù)據(jù)分析,可以看出很多人從熱點區(qū)域A,到熱點區(qū)域B的交通軌跡,對這些軌跡觀察后,可以看到絕大多數(shù)的行人會選擇最優(yōu)的交通方式,比如,最短時間、距離,或者最少的換乘。但是,一個行人(嫌疑人)選擇的交通路線為A->C->D->B。
熊輝認為,“A->C->D->B”這是一種異常的交通方式,對上述異常行為需要進一步地仔細分析,如果該人的異常行為足夠多,那么他很可能是一名扒手。
熊輝公布了研究結果,利用這種方法分析,能夠正確地識別出92.7%的小偷。
小偷是“流浪”出行模型
同時,熊輝等人對四類人在工作日早上8:00-11:00的出行模型進行分析:
正常的出行者,主要在居住地、工作地、途經(jīng)區(qū)域活動;旅游者頻繁地訪問圓明園、天安門、南鑼鼓巷等景點區(qū)域;購物者主要訪問王府井、西單等購物區(qū)域;扒手,則是一種流浪的模式,他們沒有清晰的目的地,頻繁地換乘,隨機地停留,經(jīng)常進行短途的出行。他們還在一段時間內頻繁出現(xiàn)在一些特定場所,如交通樞紐、購物區(qū)、景點等。
■溫馨提示
平時怎么防小偷
首先是站臺上的初步判斷。雖然說站臺上的乘客具有一定的流動性,但小偷一般都集中在幾個固定的站臺作案。小偷在站臺上“蹲點”的時候有些規(guī)律可循。三五個人分散在站臺上,眼睛一直盯著其他人的背包,而不是像其他人那樣看著車開來的方向。在車上乘客少的情況下,跟著從站臺擠到車門但不會直接上車。
小偷偷東西必須要近距離地接觸失竊者,所以如果市民在車上發(fā)現(xiàn)有人突然推擠過來,就應該及時提高警惕,很可能是小偷在制造偷盜機會。市民在車上發(fā)現(xiàn)失竊一定要在第一時間里報警。在報警的同時要關上所有的車窗戶和車門,在警察趕到之前要提醒車里的人相互監(jiān)督,小偷為了迅速轉移贓物,經(jīng)常栽贓他人。
不管是自己被偷,還是看見他人被偷都要及時報警,有時候警察抓到一些小偷,他們交代了偷竊事實,但因為找不到失竊者造成取證困難。
記者 蔣瑜香
原標題:公交車上誰是小偷? “神探”認得準