AI 開始進(jìn)入我們的生活,棲息在智能音箱或者手機(jī)里的它們,是能夠給你放音樂、陪聊天的助手,而在互聯(lián)網(wǎng)的灰色地帶里,它們也正成為犯罪分子的幫兇。
今年 9 月,浙江紹興警方公布,破獲全國首例利用人工智能技術(shù)竊取公民個(gè)人信息的案件,截獲了 10 億余組公民個(gè)人信息。
被警方查封的平臺(tái)叫做「快啊」,曾經(jīng)是市場上最大的打碼平臺(tái)。他們在破解、竊取、販賣和盜用個(gè)人信息實(shí)施詐騙有著完整的鏈條,其中人工智能技術(shù)運(yùn)用在識(shí)別驗(yàn)證碼這個(gè)環(huán)節(jié)。
為什么 AI 會(huì)先學(xué)習(xí)識(shí)別驗(yàn)證碼?
一般而言,黑產(chǎn)最初盜取的賬號(hào)密碼信息往往是「粗糙」的。但由于人們的同一個(gè)郵箱,通常也是多個(gè)網(wǎng)站的登陸賬號(hào),同樣的密碼往往也在多個(gè)網(wǎng)站使用。因此黑產(chǎn)會(huì)通過利用已有的賬號(hào)密碼信息,去批量嘗試這些賬號(hào)密碼能否在更多不同的平臺(tái)上登陸。
這個(gè)過程被稱為「撞庫」,而撞庫的過程中最主要的障礙就是各個(gè)網(wǎng)站設(shè)置的驗(yàn)證碼。
黑產(chǎn)使用的 AI,就是用來應(yīng)對這些驗(yàn)證碼的。為什么 AI 會(huì)先學(xué)習(xí)識(shí)別驗(yàn)證碼呢?我們先來解釋一下驗(yàn)證碼是什么。
(圖片來自安全牛)
當(dāng)我們登陸網(wǎng)站、提交信息時(shí),總能遇上驗(yàn)證步驟,尤其是在 12306 上買票時(shí),對那些圖片驗(yàn)證碼真的是咬牙切齒。但事實(shí)上,驗(yàn)證碼是各個(gè)網(wǎng)站用來對抗網(wǎng)絡(luò)黑產(chǎn)惡意登陸等行為而設(shè)置的安全策略。
驗(yàn)證碼的全名是「全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測試」,由卡內(nèi)基梅隆大學(xué)的路易斯 · 馮 · 安(Luis von Ahn)提出。圖靈測試,顧名思義,驗(yàn)證碼的目的,是為了識(shí)別網(wǎng)絡(luò)請求的發(fā)起方是人類,亦或是機(jī)器。因此早期的驗(yàn)證碼就是網(wǎng)站提出一些問題,這些問題不能被機(jī)器破解回答,又得能夠被人類輕易答對。
網(wǎng)絡(luò)黑產(chǎn)在撞庫時(shí),他們就會(huì)將所遇到的海量驗(yàn)證碼「打碼」任務(wù),交給「打碼平臺(tái)」去完成。
(撞庫流程,圖片來自:freebuf.com)
根據(jù)騰訊守護(hù)者計(jì)劃安全團(tuán)隊(duì)的介紹,網(wǎng)絡(luò)黑產(chǎn)撞庫時(shí),與打碼平臺(tái)是這樣合作的:
首先黑產(chǎn)把已竊取的帳號(hào)密碼信息導(dǎo)入到撞庫軟件,撞庫軟件模擬登錄協(xié)議,向互聯(lián)網(wǎng)公司的服務(wù)器發(fā)送登錄請求。服務(wù)器檢測到登錄異常時(shí),會(huì)通過驗(yàn)證碼來進(jìn)行攔截;
撞庫軟件將收到的驗(yàn)證碼圖片發(fā)送給「打碼平臺(tái)」,請求將圖片轉(zhuǎn)化為字符。打碼平臺(tái)后臺(tái)破解驗(yàn)證碼,將字符結(jié)果返回給撞庫軟件,完成撞庫流程,得到更多的用戶信息。
隨后這些信息可能被販賣、用于詐騙犯罪等。
早期的打碼平臺(tái),是通過眾包讓分布在各地電腦前的打碼小工來完成的。后來進(jìn)化到了「人工 + OCR 降維識(shí)別圖片」。隨著互聯(lián)網(wǎng)公司對驗(yàn)證碼識(shí)別難度的升級(jí),「人工 + OCR 降維識(shí)別圖片」的識(shí)別率在降低,因此像「快啊」這樣的打碼平臺(tái)就開始運(yùn)用 AI 技術(shù)訓(xùn)練機(jī)器,提高識(shí)別驗(yàn)證碼的精度和效率。
隨著安全防護(hù)與破解入侵兩方面的抗衡日益升級(jí),驗(yàn)證碼的難度在增加,形式也在多樣化。從簡單的字母數(shù)字、算術(shù)題,到扭曲的字符、模糊的圖片,這些被歸類為知識(shí)性驗(yàn)證碼;如今新一代的驗(yàn)證碼已經(jīng)開始向無知識(shí)型進(jìn)化,例如 Google 的 reCAPTCHA,某些網(wǎng)站需要拖動(dòng)滑條的驗(yàn)證步驟。
機(jī)器學(xué)習(xí)的發(fā)展,讓字母、數(shù)字組成的知識(shí)性驗(yàn)證碼被識(shí)別和破解的風(fēng)險(xiǎn)日漸增大,但這種驗(yàn)證碼,依然是主流。據(jù)警方公布,這次抓捕的團(tuán)伙所使用和訓(xùn)練的 AI,已經(jīng)能夠識(shí)別出 98% 以上的驗(yàn)證碼。
中國互聯(lián)網(wǎng)協(xié)會(huì)發(fā)布的《中國網(wǎng)名權(quán)益保護(hù)調(diào)查報(bào)告 2016》顯示,在 2016 年,我國 6.88 億網(wǎng)民因詐騙短信、信息泄露等造成的經(jīng)濟(jì)損失約為 915 億元。全國平均每個(gè)人的個(gè)人信息至少被泄露了 5 次。
AI 犯罪離我們有多遠(yuǎn)?
對于網(wǎng)絡(luò)黑產(chǎn)而言,AI 技術(shù)就是他們所發(fā)現(xiàn)的一把更加好用的槍支。技術(shù)本身是不分善惡的,只是看如何去運(yùn)用它、在哪些情景使用它。使用 AI 犯罪,其源頭,依然是人類本身。
今年 7 月,金融時(shí)報(bào)報(bào)道,國內(nèi)人臉識(shí)別公司云從科技(Cloud Walk)正與警方合作,開發(fā)和測試用來識(shí)別犯罪嫌疑人的人工智能,其中包括人臉識(shí)別和步態(tài)分析等技術(shù)。
總而言之,攻防雙方的對抗是一直在迭代升級(jí)的。在 AI 使用的爭議上,埃隆 · 馬斯克則是一次一次地向公眾發(fā)布自己的顧慮和警告。
早在 2014 年 8 月,馬斯克就通過推特說:AI 可能比核武器還要危險(xiǎn)。在今年 8 月,馬斯克與Google 旗下 DeepMind 聯(lián)合創(chuàng)始人穆斯塔法 · 蘇萊曼(Mustafa Suleyman),以及 26 個(gè)國家的一百多名人工智能領(lǐng)域?qū)<夜餐蚵?lián)合國發(fā)表了一封聯(lián)名信,希望能禁止有關(guān)殺人機(jī)器人的研究和使用。霍金也曾預(yù)言,2040 年 AI 的犯罪率將超過人類。
(埃隆 · 馬斯克和創(chuàng)業(yè)孵化器 Y Combinator總裁山姆 · 奧特曼聯(lián)合成立 OpenAI,圖片來自 medium.com)
2015 年,埃隆 · 馬斯克創(chuàng)立人工智能公司 Open AI,并宣布會(huì)開源共享包括深度學(xué)習(xí)技術(shù)在內(nèi)的研究成果。在 Open AI 成立前后,谷歌宣布開源 TensorFlow 人工智能引擎,F(xiàn)acebook 宣布開源 Big Sur 深度學(xué)習(xí)計(jì)算機(jī)服務(wù)器的設(shè)計(jì)。先進(jìn)技術(shù)的獲取,似乎也隨著開源而變得簡單。
就像農(nóng)藥 DDT 能夠讓農(nóng)業(yè)種植增產(chǎn),也能讓人們患病;核技術(shù)能夠做成導(dǎo)彈武器,也能夠用來發(fā)電。新技術(shù)讓人類更輕松,也會(huì)造成新的社會(huì)問題。人工智能也不會(huì)例外,例如 AI 可以在醫(yī)療方面提供新的可能性,也能被運(yùn)用在軍事領(lǐng)域,制造成武器。
(俄、美等國已制造出可實(shí)現(xiàn)自動(dòng)駕駛、控制的坦克機(jī)器人,圖片來自:Recode)
隨著人工智能的普及,我們會(huì)發(fā)現(xiàn)它們在很多方面比人類更聰明、高效,這個(gè)過程一開始是悄無聲息只有蛛絲馬跡,但當(dāng)?shù)搅四骋粋€(gè)拐點(diǎn),我們就會(huì)發(fā)現(xiàn)這個(gè)趨勢不可逆轉(zhuǎn)。
不過焦慮著急也沒有用,在現(xiàn)階段,我們還是靜靜地感受那些宣稱搭載了 AI 技術(shù)的手機(jī),怎么幫你把照片拍得好看,圖片修得更美吧。