1月21日,全球OCR領域公認最權威的學術會議“2017國際文檔分析與識別大會(ICDAR)”揭曉2017ICDAR競賽結果,360企業(yè)安全人工智能團隊憑借深度學習OCR技術獲得自然場景中文文字識別比賽第一名。 ICDAR專注于文本領域的識別與應用,有OCR領域的奧斯卡盛會之稱,是全球OCR領域公認最權威的學術會議之一,由其組織的RCTW-17競賽也是當前OCR技術領域全球最具影響力的比賽之一,競賽中的諸多方法對文字識別技術的發(fā)展具有強大推動力。高技術難度、強大實際應用性,也使該盛會受到科研院校、科技公司等的關注,至今已有89個國家的3500多支隊伍參與。
ICDAR官網公布的比賽成績單
360企業(yè)安全人工智能團隊參加的專門針對中文識別的“端到端識別任務”是該項賽事的高難度項目,評測和檢驗的是對自然場景和網絡圖片、以及復雜視頻中的文字的提取和智能識別能力,比賽中主辦方會提供街道視圖、海報、菜單、室內場景和屏幕截圖等大規(guī)模的圖片,這些圖片中文字有傾斜、垂直、不同字體、各種清晰度等非常不規(guī)則和多樣化的形態(tài),是傳統(tǒng)OCR無法提取和識別的,這也是人工智能技術應用的一個重要方向。
最終360企業(yè)安全人工智能團隊憑借在深度學習領域的深厚技術積累和應用實踐獲得了該項目的冠軍。并同時獲得了另一個項目“文字檢測任務”的第四名。
ICDAR官網公布的比賽圖例
該團隊負責人王占一表示,OCR技術可以廣泛應用于卡證類、票據(jù)類的文字識別、車牌檢測識別、商標識別、道路標識識別、自動駕駛等,大大提升產品檢測識別效果和用戶體驗,降低人力成本。360企業(yè)安全的深度學習OCR技術適用于政企機構的數(shù)據(jù)防泄露和網站內容違規(guī)監(jiān)測中,對代碼、郵件、文件等不同類型的文檔進行分類,然后識別發(fā)現(xiàn)文檔中的違規(guī)行為,對違規(guī)文檔進行過濾;標記被監(jiān)測網站中的圖片,對圖片中的違規(guī)、違法、色情的文字內容進行識別發(fā)現(xiàn)。