神探夏洛克可能要和警方說(shuō)再見(jiàn)了。最近,英國警方開(kāi)始試驗一個(gè)叫VALCRI(Visual Analytics for sense-making in Criminal Intelligence Analysis)的計算機程序,它可以在短時(shí)間內分析犯罪數據,從而幫助警方破獲案件,可能比夏洛克還厲害。
VALCRI的主要任務(wù)是幫助警察生成合理的場(chǎng)景,也就是何時(shí)何地何人何動(dòng)機在進(jìn)行犯罪行為。它可以通過(guò)掃描數百萬(wàn)的刑事檔案記錄、筆錄資料、圖像、視頻等資源來(lái)確認這些信息是否與案件本身相關(guān)。這些結果將呈現在兩個(gè)大型觸摸屏上,與犯罪分析師進(jìn)行交互。
一個(gè)關(guān)于邏輯思維游戲
“VALCRI能定位殘留在幾個(gè)犯罪現場(chǎng)的彈殼——分析師判斷彈殼和案件本身有沒(méi)有關(guān)系,VALCRI再根據分析師的判斷調整結果”,密德薩斯大學(xué)的Neesha Kodagoda這樣評價(jià)道。
正由于應用了機器學(xué)習,系統在與分析師交互的基礎上提高了搜索性能。分析師可以通過(guò)調節不同標準的權重改變標準的重要性,從而讓VALCRI做出最合適的判斷。
一般來(lái)說(shuō),分析師在處理未知案件的第一步就是搜尋警察數據庫的相關(guān)事件。通過(guò)搜集嫌疑人的作案時(shí)間、地點(diǎn)、手法來(lái)判斷案件本身與嫌疑人的關(guān)聯(lián)性。,Kodagoda還說(shuō),“一位經(jīng)驗豐富的分析師需要73人協(xié)助才能收集到所有信息,而VALCRI僅僅通過(guò)一次單擊就能完成”。
可以產(chǎn)生聯(lián)想
雖然警察記錄的信息量大且繁冗,但算法會(huì )驅動(dòng)系統在基礎認知水平上理解問(wèn)題。
在不同的犯罪現場(chǎng)的不同目擊者可能用不同的詞匯描述一個(gè)衣著(zhù)不整的人??赡軙?huì )用“襤褸”,可能是“亂蓬蓬”,也可能是“凌亂”。人類(lèi)在聽(tīng)到這些詞語(yǔ)時(shí)會(huì )正常的聯(lián)想到他們可能描述的是同一人,而VALCRI也可以做出這樣的聯(lián)想。這個(gè)系統甚至也可以利用面部識別軟件在監控或圖片中識別人臉。
最近,英國西米德蘭茲警察局正在用三年的匿名數據(總計達650萬(wàn)條數據)訓練VALCRI。比利時(shí)的安特衛普警察也在進(jìn)行測試。
施行困難重重
下個(gè)階段的任務(wù)是讓VALCRI在犯罪發(fā)生時(shí)的非匿名數據下運行。警察在調查期間使用的技術(shù)可能會(huì )在法庭上遭到質(zhì)疑,所以過(guò)早或不正確的部署VALCRI可能會(huì )導致案件難以審判。當然,各國之間允許警察獲取的數據也有所不同。
另一個(gè)施行難點(diǎn)是,很多人難以接受計算機預測犯罪概率并敘述犯罪情況。VALCRI的團隊成員Ifan Shepherd表示,“如果犯罪案件中的數據不清晰,那么VALCRI的分析情況也不容樂(lè )觀(guān)。人類(lèi)分析師總要在案件中做最后把關(guān)”。
可能引入偏見(jiàn)
喬治亞理工大學(xué)的Mark Riedl表示:“機器學(xué)習可以幫助警察,但也會(huì )引入一些新的偏見(jiàn)”。系統確實(shí)會(huì )確定所有的相關(guān)特征,同時(shí)也必定錯過(guò)了一些信息。
VALCRI試圖通過(guò)將過(guò)程透明化解決這個(gè)問(wèn)題。如果每個(gè)決定都可以被溯源,那么正確結果永遠不會(huì )被隱瞞。
寫(xiě)到這里幾乎可以確定,VALCRI比夏洛克還厲害了。