兩周前才在烏鎮世界互聯網大會秀了一把“實時機器翻譯”,11月30日,搜狗CEO王小川又跑去香港科技大學再度表演機器同傳,然而,接連兩次的現場演示卻在網絡上引發了一波“偽科技”的質疑,主要疑問點如下:
追問一:搜狗機器同傳準確率90%靠譜嗎?
在烏鎮世界互聯網大會上,王小川首秀搜狗實時機器翻譯,演講現場不僅實時語音識別顯示中文內容,還有機器同步翻譯成英文,生成雙語滾動字幕。據搜狗方面稱,其機器翻譯準確率達90%,未來有望取代人類同傳。
真的是這樣嗎?
據專業人士介紹,目前國際機器翻譯界衡量機翻水平,主要應用的是IBM的watson研究中心在02年提出的BLEU方法,這種方法的思想是用翻譯結果中連續出現的N元組(n個單詞/字或標點)與參考譯文中出現的N元組進行比較,計算完全匹配的N元組的個數與翻譯結果中N元組的總個數的比例。這是一種類似準確率的計算方法,它允許一個原文有多個參考譯文。
然而搜狗的90%準確率卻并沒有通過類似的嚴謹求證,而是僅僅憑借兩次現場展示,以及不時出現的“中式英語”翻譯,便得出“秒殺同傳、AI里程碑”的結論。
事實上,無論是谷歌微軟,還是百度有道金山等,國內外目前對于機器翻譯的準確率并沒有一個準確的數據,基本都以“翻譯錯誤降低率”來衡量其進步,而搜狗卻直接對外拋出了90%的準確率,著實令業內嘩然。
那么,為何沒有通過任何檢驗的搜狗機器同傳,卻有自信在公開場合大秀其技呢?
追問二:時而智能時而業余,實時機翻有沒有提前排練過?
在此前烏鎮世界互聯網大會上,雖然翻譯結果出現了語焉不詳的“中式英語”,但還是可以勉強看懂。然而此次香港科技大學演示過程中,卻出現了前后矛盾的現場BUG。
如圖所示,當王小川講到“計算機的智能會去顛覆一個又一個的行業”時,中文字幕中的 “會”被錯誤地識別為“匯”,然而下方的英文翻譯卻絲毫未受影響。
機器可以自動識別錯別字不受其影響,可謂是實時機翻的一大進步,然而在隨后的演示中,搜狗翻譯卻又犯了一個極其低端的錯誤——將“飛機落地”翻譯成有“墜機”之意的“fell down”。
盡管事后搜狗方面將其描述為“機器翻譯偶爾會犯的小錯誤”,并稱“比起要求100%的絕對準確率,這種從0到1的突破與創新更讓人驚喜”,但這并不能讓人信服。畢竟,能智能地修正錯誤中文,卻無法翻譯出常用詞匯,這顯然是矛盾的。
此外,這些BUG的出現也不禁讓人質疑,難不成機器翻譯早已熟知稿件,而并非根據實時中文來進行翻譯?據了解,以機器翻譯界的目前發展狀況,如果將演講稿提前翻譯出來,在短時間內對機器進行強化訓練,也確實可以達到演示級別的效果。比如在上圖中,將“顛覆一個又一個的行業”翻譯成“turn a new industry”,便是較為明顯的人工干預結果。
面對眾說紛紜的猜測,搜狗方面并沒有回應。事實上,想要解釋這個問題并不難,只要讓用戶來嘗試一番便能得出最直接的產品評測,然而,從始至終,不知道你發現沒有,搜狗實時機翻的用戶只有王小川一人。
追問三:只聞其聲不見其形,搜狗機器同傳何時才能真正落地?
從烏鎮世界互聯網大會到香港科技大學,搜狗一路對外展示實時機器翻譯的黑科技, “準確率達90%”、“取代人類同傳”等宣傳引起了媒體和用戶的關注與好奇,然而卻對產品技術真正的落地時間、何時實現大規模用戶體驗等問題三緘其口。
技術成型卻無法落地產品,能夠在千人圍觀的發布會現場展示卻無法向用戶開放試用,搜狗此舉不禁讓外界質疑是在為用戶“畫餅”以增加自己贏得市場的機會。
產品未出,概念先行,“猶抱琵琶半遮面”的搜狗實時機器翻譯究竟何時才能走進用戶視野、帶來真實的使用體驗,目前來看仍然是一個謎。
追問四:秒殺人類同傳,是技術的自信還是對翻譯行業的消費?
在搜狗對實時機器翻譯的傳播中,“秒殺同傳”、“取代人類翻譯”的言辭頻頻出現,王小川甚至在個人微博上宣稱“機器人登場,以后別讓孩子再報考同聲傳譯專業了”。那么,搜狗的實時機器翻譯是否真的可以完全取代人類同傳呢?
事實上,同聲傳譯需要有極高的資格才可以擔任。根據 AIIC(國際會議口譯員協會)的規定,同傳譯員需要翻譯出演講者內容的80%,(90 %~100 %的“同傳”幾乎不可能)。在同聲傳譯中,譯員需要遵循順句驅動、隨時調整、適度超前、信息重組、合理簡約、信息等值等基本原則,此外,由于演講者講話速度普遍較快,演講中可能摻雜各地口音和方言,同傳譯員還需要調動自己的一切知識儲備和經驗全力以赴。
無論是兩國外交,還是商業合作,扮演實時溝通角色的同傳都是值得敬畏和尊重的,而這不應該作為機器翻譯成熟路上的“噱頭”來消費。
在知乎上,北京語言大學高級翻譯學院教師PKUCATer表示,從搜狗機器翻譯的現場表現看, 90%準確率是很讓人懷疑的,“不客氣的說,沒有一句話是翻譯對的”。看來,搜狗取代人類同傳的高調口號在短期內還只是空談。
追問五:過度的夸張與宣傳 人工智能正在被誰消費?
人工智能的發展,迄今已有六十多年,期間經歷過兩次高峰和兩次低谷。上世紀80年代,“專家系統”的AI程序開始為全世界的公司所采納,而“知識處理”成為了主流AI研究的焦點。1981年,日本經濟產業省撥款八億五千萬美元支持第五代計算機項目,其目標是造出能夠與人對話,翻譯語言,解釋圖像,并且像人一樣推理的機器。
但由于當時計算機的運算能力的限制和算法的難以收斂直接導致了直到2000年第二次AI的冬天。日本第五代計算機的研制最終宣告失敗,并大幅削減投入。
讓備受期待的人工智能跌入低谷,或許是圍觀群眾們的過度樂觀,然而更多的責任卻源于企業與媒體不負責任的夸張與宣傳。
“烏鎮技術改變世界,搜狗“黑科技”或顛覆同傳產業”
“王小川WIC演講秀搜狗實時機器翻譯技術 準確率90%有望取代人類同傳”
“世界互聯網大會搜狗秀AI黑科技 實時機器翻譯秒殺同傳”
……
盡管人工智能已成為2016年度熱詞,但對于大部分人而言,依然沒有時間或者機會去了解。如果科技公司給予人們太多不切實際的幻想,那么無形中也將透支著公眾對于AI的興趣。
此外,通過試用國內外其他翻譯軟件我們也會發現,神經機器翻譯系統目前所能做的只是優化翻譯結果,并不是萬能藥,將其作為黑科技大書特書,過分拔高人們對于機器翻譯實際水平的期待,實際上并不可取。
沒有權威的考核標準,缺乏臨場應變的實力,頻遭翻譯領域人士吐槽……搜狗如今面臨的困境恰如昔日的南郭先生,面對好合奏的宣王,尚可在人工智能的隊伍里濫竽充數,然而一旦面臨喜歡獨奏的的湣王,卻難以承受每一個用戶個體的考驗。想要趁早擺脫偽科技公關秀的帽子,為今之計,只有快速落地產品了。