美國馬里蘭大學(xué)的四位研究員開源了一個(gè)名為 UnCaptcha 的工具,能夠破解谷歌的驗(yàn)證碼系統(tǒng) ReCaptcha,其進(jìn)行語音驗(yàn)證的準(zhǔn)確率高達(dá) 85%。

與眾多驗(yàn)證機(jī)制一樣,早期的 ReCaptcha 系統(tǒng)通過數(shù)字驗(yàn)證碼進(jìn)行識別,以此確保操作方是人類而非機(jī)器人。但是,2012 年一個(gè)谷歌研究團(tuán)隊(duì)幾乎百分之百破解了其文本驗(yàn)證碼系統(tǒng)。于是谷歌在這之后的升級版當(dāng)中加入了語音和圖像驗(yàn)證的方式。

如今,上述驗(yàn)證方式再次遭遇巨大挑戰(zhàn)。“谷歌的 ReCaptcha 系統(tǒng)使用了一些高級的分析工具來判斷一個(gè)用戶到底是人還是機(jī)器人。他們使用了多種元素,包括 cookie、解題的速度、鼠標(biāo)的移動(dòng)以及解題的成功率。”

谷歌ReCaptcha系統(tǒng)被破解,機(jī)器語音驗(yàn)證準(zhǔn)確率高達(dá)85%

據(jù)該項(xiàng)目負(fù)責(zé)人稱:“ReCaptcha 系統(tǒng)的語音識別體制由一長串?dāng)?shù)字讀音組成,每個(gè)字的語速、音調(diào)都不相同,甚至還會改變口音。為了解析這些數(shù)字,首先需要從網(wǎng)頁上將音頻文件下載下來,再導(dǎo)入到在線的語音識別工具中(比如 IBM、谷歌云、谷歌語音識別、Sphinx、Wit-AI、微軟 Bing 語音識別)進(jìn)行識別,再將解析后的結(jié)果嵌入驗(yàn)證框即可通過驗(yàn)證。”

目前,UnCaptcha 工具已經(jīng)在著名的 Reddit 網(wǎng)站進(jìn)行實(shí)驗(yàn)。據(jù)悉,實(shí)驗(yàn)者在進(jìn)行用戶注冊那一步的時(shí)候終止了實(shí)驗(yàn),這也是為了不給該網(wǎng)站增添不必要的運(yùn)營風(fēng)險(xiǎn)。

“實(shí)驗(yàn)結(jié)果非常明顯,UnCaptcha 在識別數(shù)字方面的準(zhǔn)確率高達(dá) 92%,整體語音識別準(zhǔn)確率達(dá)到了 85%。”雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))獲悉,該工具的發(fā)明者在一份聲明中稱:“這種工具能夠破解最新版的 ReCaptcha,但這僅限于在自己網(wǎng)站上使用且僅用于教育目的。”

得到破解技術(shù)后,該負(fù)責(zé)人第一時(shí)間通知了谷歌并督促對現(xiàn)有驗(yàn)證方式進(jìn)行升級。目前,UnCaptcha 工具已經(jīng)開源,并被托管在 GitHub 上提供了安裝使用示例。

在 GitHub 上,吃瓜群眾們也針對此事展開討論。有網(wǎng)友稱:“此項(xiàng)目中的核心破解技巧使用到了各家的語音識別技術(shù),這其中也包括谷歌,這讓人看起來多少有點(diǎn)‘搬起石頭砸自己腳’的意味。”