中新經緯12月23日電 實現跨語言無障礙溝通,是人們長久以來的夢想。自2011年上線首款產品至今,百度翻譯已經走過十個年頭。12月22日,百度翻譯首次公布十年成績單:
十年來,從基于互聯(lián)網大數據的多策略融合機器翻譯到率先發(fā)布大規(guī)模神經網絡翻譯系統(tǒng),從中英翻譯到支持200多種語言互譯,從單一文本翻譯到融合語言、語音和圖像的跨模態(tài)翻譯,以及翻譯APP、AI同傳、開放平臺等全面豐富的產品矩陣;十年來,領域翻譯準確率90%以上,語言數量擴大了100倍,翻譯方向增長了20000多倍,日均翻譯量超千億字符,服務50多萬企事業(yè)單位和個人開發(fā)者,較十年前增長了130倍。
百度翻譯始終把握并引領技術和產業(yè)發(fā)展趨勢,推動機器翻譯技術和產業(yè)的跨越式發(fā)展。百度翻譯的年度翻譯熱詞,也折射著中國對外溝通交流的時代縮影。
技術創(chuàng)新層面,2015年5月,百度發(fā)布全球首個互聯(lián)網神經網絡翻譯系統(tǒng),攻克多項國際公認技術難題,世界范圍內率先實現了神經網絡機器翻譯的大規(guī)模產業(yè)應用。領先谷歌16個月,引領機器翻譯產業(yè)化實現了從統(tǒng)計機器翻譯(SMT)到神經網絡機器翻譯(NMT)的跨越。
歷經十年核心技術攻關,翻譯質量提升了30個百分點;在新聞、科技文獻等領域翻譯上,翻譯準確度達到90%以上。相關成果斬獲國家科技進步二等獎,北京市科技進步一等獎等多項獎勵。
語言數量層面,百度翻譯從上線之初支持中、英兩種語言互譯,到全球率先實現200種語言互譯,十年間支持的語言數量增長了100倍,翻譯方向增長了20000多倍,覆蓋全球99%的人口,讓人類自由交流的夢想照進現實。這背后得益于百度翻譯克服語言資源稀缺、分布不均等難題,建立了多語言翻譯統(tǒng)一框架,提升多語言翻譯質量和效率,并大幅降低部署成本。在“一帶一路”倡議提出、RCEP自貿協(xié)定簽署、國家強調促進國內國際雙循環(huán)的時代背景下,百度的多語言翻譯,促進語言互通,助力我國的高水平開放。
翻譯形式及模態(tài)層面,十年間,百度翻譯融合自然語言處理、語音、計算機視覺等AI技術,從最初支持文本的單一模態(tài)翻譯,擴展為語音翻譯、拍照翻譯、視頻翻譯等跨模態(tài)翻譯,翻譯場景不斷豐富。
其中最典型的場景就是機器同傳。百度率先提出了“語義單元”驅動的機器同聲傳譯模型,解決了翻譯質量和同傳時延難以兼顧的難題,研發(fā)了高質量、低時延的機器同傳系統(tǒng),翻譯準確率超過80%,平均時間延遲3秒,媲美人類同傳。成功應用于中國國際服務貿易交易會、中國國際進口博覽會等大型會議。
產品層面,經過十年,百度翻譯現已形成包括翻譯PC版、翻譯APP、AI同傳會議版、同傳助手、小程序以及翻譯開放平臺等全面的產品矩陣。近日,百度翻譯全新發(fā)布APP 10.0版本,推出全場景、跨平臺、跨模態(tài)AI同傳服務等,產業(yè)矩陣進一步豐富。
近年來,翻譯需求井噴式爆發(fā),機器翻譯進入了翻譯大生產時代。百度翻譯每天翻譯超千億字符,相比十年前,日均翻譯字符量擴大了10萬倍。通過百度翻譯開放平臺,累計支持50多萬機構和個人開發(fā)者,對比十年前,數量增長130倍,廣泛服務于能源、通信、政務、新聞、金融等30多個重要領域。百度翻譯已經成為全球跨語言交流的重要工具和平臺。
開放是當代中國的鮮明標識,全球互聯(lián)互通更是大勢所趨。百度翻譯的十年發(fā)展歷程,折射著中國對外開放交流的時代縮影,詮釋著中國科技自主創(chuàng)新的活力和實力。(中新經緯APP)