近日,外媒在一篇文章中闡述了AI與翻譯行業(yè)的發(fā)展前景,其中提到在近兩年里機器翻譯的質量得到了大幅的提高,也許在幾年后大部分企業(yè)文件都可以用AI翻譯了。
不管這是不是真的,AI的確在翻譯方面已經(jīng)為人們帶來了便利,比如醫(yī)療文件的翻譯、語音翻譯、字幕翻譯,有道、百度和搜狗等公司甚至還推出了實景AR翻譯,利用方便有趣的應用為語言不通的游客解決了不少問題。在測試過科大訊飛1.0翻譯機后發(fā)現(xiàn),機器翻譯相比于兩三年前已經(jīng)取得了長足的進步,隨著科大訊飛2.·0的推出,想必會有更多人使用這種支持33中語言的機器來進行翻譯工作了。
感受最深的,是以往看美劇的時候,字幕都是由人工字幕組翻譯的,而隨著今年年初網(wǎng)易見外AI智能語音轉寫聽翻平臺的出現(xiàn),一些首發(fā)的美劇字幕已經(jīng)變成了網(wǎng)易見外AI聽翻+人工校對了,AI不僅能聽寫還能翻譯,速度比人工還快,看到這里字幕君們是否有點瑟瑟發(fā)抖了?此外,就連Youtube小視頻也開始提供多語言機翻功能了。AI技術竟連方言翻譯都不放過,科大訊飛和亞馬遜等公司也已經(jīng)在研發(fā)實時方言轉換系統(tǒng)了。
對此,世界上最大的人工翻譯機構之一One Hour Translation的CEO Ofer Shoshan表示大家應該開始面對未來工作將會被機器取代這一可怕事實,而且在幾年內,神經(jīng)機器翻譯(NMT)將會負責翻譯市場一半以上的工作量。
從他的話來看,似乎未來AI的職責并不僅僅是輔助人類,而是會替代一些人類工作。
Shoshan補充,隨著機器翻譯在近兩年來的跨越式發(fā)展,過不了多久50幾萬人工翻譯和21000家翻譯機構都會失業(yè)。這就好比數(shù)字攝影與柯達公司,柯達萬萬沒想到未來市場會被數(shù)碼相機取代,而再早之前的Corona打字機也是這么被文字處理軟件取代了。
Shoshan還表示,閱讀兩年前機器翻譯出來的東西只能了解個大概意思,那時候的翻譯寧可自己手動翻譯,但是現(xiàn)在的神經(jīng)機器,已經(jīng)可以將越來越多的內容翻譯到只需要做一點點改動就可以達到人工標準的水平了。
目前,Shoshan公司用機器翻譯的文件中,平均只有1成需要人工校對,翻譯的結果足以讓其財富500強的客戶滿意,而兩年前這個數(shù)據(jù)為8成。
這是因為神經(jīng)機器翻譯,也就是深度學習,取代了之前的統(tǒng)計翻譯技術,在大多數(shù)高級翻譯工具上都得到了應用,谷歌、必應和亞馬遜等公司的翻譯技術都使用了神經(jīng)機器翻譯。
訓練神經(jīng)機器翻譯的方法簡單直接,只需要給其神經(jīng)網(wǎng)絡算法灌輸大量的語言信息。因此,為了適應翻譯市場的飛速轉變,One Hour Translation也使用了翻譯工具,并對其進行分類,與其最擅長的領域進行匹配。
比如,在旅游業(yè)領域,有些翻譯機器擅長從德語翻譯到英語,但是不太擅長日語。而有的翻譯機器擅長法語,但是不擅長德語。One Hour Translation造了一個數(shù)據(jù)庫索引來幫助企業(yè)和客戶尋找最合適的翻譯機器,可以及時快速地為任何類型的內容、任何語言匹配最合適的翻譯工具。
從One Hour Translation這一做法,也許可以看到人工翻譯在未來幾年的出路,即對比神經(jīng)機器翻譯的質量,為其打分并整理成索引。據(jù)了解,One Hour Translation公司每一個季度做一次整理,重新評比每個翻譯機器。
不過,Shoshan表示,這種工作并不需要太多的翻譯專業(yè)知識,不管是給翻譯機器打分還是人工校對機翻,需要的專業(yè)性遠比人工翻譯低得多。能勝任這項工作的應該是,語言技巧高的聰明人,不一定非要使專業(yè)的傳統(tǒng)翻譯,因為機翻內容上需要修改的地方很少,比人工翻譯簡單得多。
這讓人不禁思考,AI的興起會不會重現(xiàn)第一次工業(yè)革命的場景,會不會有一大群翻譯跑到街上抗議、摧毀翻譯機這種情況出現(xiàn)?最近在一個Youtube視頻中就看到一個真事,一個送外賣的女孩對著外賣機器人大喊:“你,就是你滾出我的地盤,我討厭你。”
對此,Shoshan表示,說不好,不過被AI威脅的行業(yè)不只有翻譯,目前美國400萬左右卡車司機也將面臨著被無人駕駛卡車搶走飯碗的威脅。
Shoshan上說道:“更重要的是,這件事會在1到3年內發(fā)生,而不是5到10年。很顯然如果機器能做人的工作,那人就多余了,雖然很多翻譯和翻譯公司都說短時間內專業(yè)領域的機翻還需要人工校對。”
“對于有些內容來說也許是這樣沒錯,但是估計目前市場上8成的企業(yè)文件在未來1到3年都能被機器翻譯。”
說了這么多,那翻譯們該怎么做才能不被時代淘汰呢?比較明顯的一種辦法,就是學習小語種。因為訓練神經(jīng)機器翻譯依靠的是大量的語言數(shù)據(jù),對于適用人群少的小語種來說,可能沒有足夠訓練AI算法的數(shù)據(jù),尤其是專業(yè)性強的技術類或科學類領域的內容。
另一種辦法,就是像One Hour Translation一樣,習慣和機器一同工作,讓機器去做大量重復的工作,而人類來鑒定機翻的質量,并為不同的工作匹配合適的工具。
就像李開復曾說過的,在這場人工智能摧毀工作的浩劫中,唯有創(chuàng)造性工作才能從中全身而退。所以,面對時代的變遷,我們唯一不能做的就是對其充耳不聞,因為這樣很容易導致失業(yè)。