“驗證碼的進步就是一個‘研究、破解、提升、再破解、再彌補’的過程,國際、國內的許多公司常向我們尋求建議?!?013年,各大網站紛紛推出空心驗證碼,它打破了傳統的實心字體的模式,用輪廓線的空心字體替代。這樣當多個字符重疊粘連的時候,機器識別度較差,但是人類仍然可以很好的識別。但高海昌發現,只需先將空心填充成實心字符,使用顏色填充算法得到離散的筆畫塊。然后使用卷積神經網絡和深度優先算法對筆畫塊進行組合識別,尋求最優解作為識別結果,此類驗證碼也可就此被破解。
“我們針對Yahoo、百度、新浪、騰訊、和中國移動在線支付網站的空心驗證碼分別取得了36%、51%、59%、89%和66%的成功率?!贝顺晒难芯课恼隆癟he robustness of hollow CAPTCHAs”被密碼學和信息安全領域享有崇高聲譽、公認的頂級國際學術會議之一的ACM CCS 2013正式錄用,這也是中國大陸研究機構首次有論文在這個高檔次會議上發表。
“Yahoo和騰訊等公司的空心驗證碼被攻破后,也主動聯系我們,希望我們能對其驗證碼改進提供幫助。如今,騰訊公司每當推出新型驗證碼后,總會首先讓我的團隊試一試能否破解?!备吆2f,“驗證碼可以防止濫用網絡資源,與普通人生活息息相關,是網絡安全的第一關?!?/p>
未來方向:“破”與“立”中守護互聯網安全
當文本驗證碼被證明不再安全,尋找可使用簡便、安全性又高的新驗證碼,便成了高海昌目前工作的重點。“‘破’是為了更好地‘立’。想要設計新型的驗證碼,就需綜合考慮當前圖像處理和人機交互領域的最新進展和成果,盡力挖掘出人類擅長處理而計算機AI算法不擅長的?!备吆2f,“這個過程中,最難的便是如何保證驗證碼不易被破解,同時還實現用戶友好。”
近日,高海昌正致力于研究一種十分巧妙的新型圖片驗證碼。“現有計算機無法破解,方法也很簡單?!备吆2榻B說,“在背景圖片上自動生成幾個線條不連續不均勻、形狀不規則的幾何圖形,圖形之間相互交疊,背景中再加入一些短線條作為噪點,就構成我們正在提出的新型圖形驗證碼。人類很容易分辨,計算機卻難以區分識別這些不規則幾何圖形的邊界。”經試驗,尚沒有計算機程序能有效破解高海昌團隊所提出的新驗證碼。人類數起來很簡單,又能有效阻擋惡意程序,在文本驗證碼被證明不再安全、深入研究失去意義時,這種巧妙的驗證碼或許為今后相關領域的研究提供了一個值得深入探索的方向。
“缺點也并非沒有。因同一個圖片中圈的數量不能太多,否則人類也可能難以數清;數量很少的情況下,計算機存在通過多次猜測猜中驗證碼的可能。針對這種情況,我們將圖片的數量增加到5張,平均每張1到10個圈。如此,只需短短幾秒人類便可輕松通過驗證碼,同時安全性也大大提高?!蹦壳?,此驗證碼的研究文章已投給相關雜志。
盡管文字驗證碼已被證明不安全,但因其使用的便捷性,以及新型驗證碼機制的不成熟(如典型的12306圖像驗證碼),尚不可能完全被取代?!皥D形驗證碼比文本驗證碼先進,這也是技術發展的趨勢。谷歌就推出了將任意圖片切成圓形生成驗證碼,然后將圖片旋轉,用戶在使用時只需將角度轉正即可。這種驗證碼機器識別難度同樣很大。某些網站也推出了手機短信驗證等新型驗證碼,這是文本或圖片驗證碼很好的替代方式,但對服務器要求頗高。”高海昌說。
“驗證碼的研究是小步前進的,每次進步都是已有成果上的小幅推進,想要提出一種全新的驗證碼,達到魯棒性和可用性的最佳平衡,目前來說難度還很大?!备吆2f,“但安全無小事,技術上不能開倒車,在未來,運用指紋、虹膜等生物特征作為驗證碼得到普及也有可能實現的一天。堅持下去,驗證碼的發展或許會有翻天覆地的變化。”
在這場“破”與“立”的拉鋸戰中,高海昌樂在其中。
(文/西電新聞網·付一楓)