1.機(jī)器口譯的基本概念


  相對(duì)于機(jī)器翻譯,機(jī)器口譯是一個(gè)相對(duì)陌生的概念。機(jī)器口譯(MI),又稱“口語(yǔ)翻譯”(Spoken Language Translation,SLT)、“語(yǔ)音機(jī)器翻譯”(Speech-to-Speech MT)或“自動(dòng)口譯”(AutomatedInterpretation),是指讓計(jì)算機(jī)實(shí)現(xiàn)從一種語(yǔ)言的語(yǔ)音到另一種語(yǔ)言的語(yǔ)音自動(dòng)翻譯的過(guò)程(瑞諾爾, 2010)。其理想目標(biāo)是讓計(jì)算機(jī)像人一樣在持不同語(yǔ)言的說(shuō)話人之間充當(dāng)口譯員的角色。會(huì)議演講、交談(通過(guò)電話、網(wǎng)絡(luò)或面對(duì)面交流)、廣播等場(chǎng)景下的話語(yǔ)翻譯都是機(jī)器口譯應(yīng)用的重要領(lǐng)域。


 

  機(jī)器口譯可分解為三個(gè)步驟:一是語(yǔ)音識(shí)別,即機(jī)器通過(guò)軟件接收說(shuō)話人的語(yǔ)音,然后將其識(shí)別轉(zhuǎn)化為文字;二是語(yǔ)言轉(zhuǎn)換,即機(jī)器翻譯程序?qū)ξ谋具M(jìn)行加工轉(zhuǎn)譯;三是語(yǔ)音合成,即機(jī)器將譯文自動(dòng)形成目的語(yǔ)語(yǔ)音輸出。因此,機(jī)器口譯包含三項(xiàng)核心技術(shù):語(yǔ)音識(shí)別、機(jī)器翻譯和語(yǔ)音合成。


  與機(jī)器翻譯一樣,人們常把機(jī)器口譯與計(jì)算機(jī)輔助口譯(CAI)或“機(jī)助口譯”混為一談。機(jī)器口譯是全自動(dòng)口譯,無(wú)需人工輔助,例如各種在線語(yǔ)音翻譯系統(tǒng)、口語(yǔ)翻譯機(jī)、口譯機(jī)器人、自動(dòng)口譯電話等。計(jì)算機(jī)輔助口譯則指譯員在計(jì)算機(jī)的輔助之下完成口譯任務(wù)。計(jì)算機(jī)輔助口譯的原理是:計(jì)算機(jī)快速識(shí)別源語(yǔ)語(yǔ)音,然后將識(shí)別的內(nèi)容進(jìn)行機(jī)器翻譯,最后將譯文呈現(xiàn)在屏幕上,供譯員參考。不難看出,最后的譯文是顯示在屏幕上供譯員參考還是轉(zhuǎn)換成語(yǔ)音由機(jī)器播出,這是機(jī)器口譯與計(jì)算機(jī)輔助口譯的根本區(qū)別之所在。


  2. 機(jī)器口譯的優(yōu)缺點(diǎn)


  機(jī)器口譯有著人工口譯難以企及的一系列優(yōu)點(diǎn):


  一是成本低。人工口譯培養(yǎng)周期長(zhǎng)、難度大、費(fèi)用高,特別是同傳,國(guó)際會(huì)議上每個(gè)語(yǔ)種往往需要安排兩名譯員,人力和開支要求均比較高;機(jī)器口譯使用成本低,有的甚至完全免費(fèi)。


  二是效率高。人工口譯費(fèi)時(shí)、費(fèi)事、效率低下,還時(shí)常出現(xiàn)翻譯盲點(diǎn),且譯員受體力、腦力和能力的限制,難以長(zhǎng)時(shí)間、不間斷、高強(qiáng)度地工作,特別是同傳;機(jī)器口譯速度快、效率高,不會(huì)疲勞,且受海量數(shù)據(jù)支持,學(xué)習(xí)快,無(wú)翻譯盲點(diǎn),可以大大提高翻譯效率和同傳準(zhǔn)確性。


  三是使用方便。人工口譯難找,特別是非通用語(yǔ)種;機(jī)器口譯不受語(yǔ)種和時(shí)空的限制,一個(gè)系統(tǒng)可同時(shí)安裝幾種、幾十種甚至幾百種語(yǔ)言互譯,因而方便、快捷、省事,尤其是準(zhǔn)確性要求不高的口譯。此外,國(guó)際會(huì)議上同傳設(shè)備使用麻煩,同傳接收機(jī)經(jīng)常不夠用,且容易丟失,引發(fā)糾紛;機(jī)器口譯相對(duì)簡(jiǎn)便,只需在智能手機(jī)或平板電腦上安裝一個(gè)應(yīng)用軟件即可收聽同傳或者進(jìn)行交談。


  當(dāng)然,機(jī)器口譯也存在著一系列缺點(diǎn),主要瓶頸有兩個(gè):


  一是語(yǔ)音識(shí)別軟件尚不完美。語(yǔ)音識(shí)別的準(zhǔn)確性與說(shuō)話人的口語(yǔ)質(zhì)量和周圍環(huán)境密切相關(guān)。目前,多數(shù)語(yǔ)音翻譯系統(tǒng)和應(yīng)用軟件只能識(shí)別語(yǔ)速不快、發(fā)音規(guī)范、前后連貫的語(yǔ)句。假如說(shuō)話人語(yǔ)速很快,講話不連貫,或者講方言、帶口音、吐字不清、發(fā)音錯(cuò)誤、使用同音字,語(yǔ)音識(shí)別系統(tǒng)就會(huì)出錯(cuò)。同時(shí),環(huán)境噪聲(背景噪聲、背景語(yǔ)音、混響、回聲、多人講話)、信道噪聲(麥克風(fēng)調(diào)整、電話調(diào)整、電話蜂音)、網(wǎng)絡(luò)連接不暢、說(shuō)話人距離遠(yuǎn),都會(huì)嚴(yán)重降低語(yǔ)音識(shí)別的準(zhǔn)確率。


  二是機(jī)器翻譯不夠準(zhǔn)確。機(jī)器算法無(wú)法理解和翻譯語(yǔ)言文學(xué)性,包括文化、語(yǔ)境、語(yǔ)法和情感。人類語(yǔ)言非常復(fù)雜,許多詞語(yǔ)是多義的,具體意思取決于特定的語(yǔ)境。機(jī)器翻譯常常忽略上下文來(lái)翻譯詞句,也不遵守語(yǔ)法,因而譯文生硬,常常伴有語(yǔ)法和語(yǔ)序錯(cuò)誤,準(zhǔn)確性和流暢性較差。目前,機(jī)器翻譯還基本停留在表層結(jié)構(gòu)的句法分析之上,無(wú)法像人腦一樣理解意義、區(qū)分情感色彩和文化差異,因而無(wú)法識(shí)別和傳達(dá)語(yǔ)言的深層含義、言外之意和文化元素(包括幽默和隱喻)。