
提到警務大數據預測犯罪,人們立刻會聯想到電影《少數派報告》和CBS電視劇《數字追兇》,在今天的移動社交時代,社會化媒體的實時分析將成為警務大數據預測分析的熱點領域,但這將意味著實時分析海量大數據的技術挑戰,也就是從“大數據警務”到“快數據警務”的挑戰。
也許不久后,紐約城警察局就能使用帶地理位置標簽的推文來預測犯罪。這聽起來就像是科幻電影少數派報 告里的場景(更像美國隊長2里的場景有木有,Hail Hydra),不過當我聯系這項技術背后的弗吉尼亞大學研究員Matthew Greber博士時,他解釋說這個系統并不是玄幻的,而是數學可行的。
Greber博士設計的這個系統,混合了各種新舊技術。當下,許多警察局會根據犯罪頻率特定地監控一些犯罪熱點。這個方法被稱作核密度估計(KDE),它 可以把歷史犯罪記錄和地理位置信息結合起來,用一個幾率函數計算出該地區未來會發生犯罪的幾率。不過,根據Gerber博士的研究論文“使用推特和核密度估計預測犯罪”,這個方法與推特的實時動態數據流相比,簡直弱爆了。
Greber博士的方法與KDE相似,但用網絡數據和編程語言替代了檔案。這套系統能繪制出一個推特環境,就像當下警察用KDE方法繪制出物理環境一樣。 大的差別在于,Greber博士看的是人們實時談論的熱點,和他們的后續動作,得到他們的匹配度。
Greber說,這個算法可以尋找區域內暗示即將發生犯罪 的特定語句,“我們會觀察人們談論的話,出去啊,喝酒啊,逛吧啊,看比賽啊之類的。這些事件通常會與犯罪相關,這也就是模型要挑出的東西。”
一旦收集到了數據,推文上的GPS標簽允許Greber和團隊們在虛擬地圖上標出潛在犯罪的熱點。當然,并不是每個發推說待會逛酒吧的人都會實施犯罪。 Greber還比較了兩種KDE預測方法的準確度。不過問題是,這個方法真的有用么?對于Greber來說,答案是肯定有點用的。“它能幫助一些人,也會 打擊一些人”。
根據研究結果,基于推特的KDE算法與傳統KDE方法相比,在預測跟蹤,刑事損害,和賭博問題的準確度上有所提升。但在縱火,綁架,勒索等問題上,準確度 卻相對較低。盡管尚不清楚為何使用推特反而更難預測這些犯罪,不過研究表示,這個問題可能與在推特上使用的語言有關,速記,非正式語言,會讓算法難以分 析。
這種高科技預防犯罪手段引發了很多關于濫用用戶隱私的爭論。讓警察使用這些數據來追蹤罪犯,讓事情變得極為敏感。關于這一點,盡管Greber知道一些社 會批評家反對國家使用私人數據,但他卻是漠不關心。“人們勾選了用戶協議允許推文上帶有GPS標簽。這個一個可選的東西,如果你不勾選,你的數據就不會被 收集。推特是一個公開的服務,我想大家很清楚這一點。”
Greber堅持說,使用這個系統對個人并沒有威脅,因為它只會記錄個人姓名,并不會對個人建模,也不會去識別罪犯。不過,問題并不在于警察會不會針對個人,而是團體和社區。這項技術的用處主要在于讓警察能高效地定位。
不過,Greber反駁說,“你可以說它會讓警察針對社區,但事實上,警察已經這么做了。警察們很清楚哪些社區比較壞,而且會針對性地分配更多警力。”
Greber說,紐約警察局會先在皇后區和布朗克斯區試點使用(滿滿的惡意啊)。不過,大范圍采用還言之尚早,因為還沒有測試它是否真的能降低犯罪率。

