機器翻譯

出自偽基百科

機器翻譯,由首字母縮略詞MT有時提到,是調查對電腦軟體的用途翻譯文本或講話從一種自然語言到另一個計算語言學的子體。在它基本的水平,MT執行詞的簡單的代替用一種自然語言為詞在另。使用語科庫技術,更加複雜的翻譯也許試圖,考慮到更好處理在成語的語言預兆、詞組認識,和翻譯上的區別,並且反常現象的隔離。

當前的機器翻譯軟體經常考慮到定製由領域或行業(譬如天氣報告)--改進產品經過限制範圍允許的代替。這個技術是特別有效的在正式或公式的語言被使用的領域。它隨後而來然後,政府法律文件的機器翻譯欣然導致能用的產品比交談或較少規範化的文本。

改善的產品質量可能由人的干預並且達到:例如,一些系統能更加準確地翻譯如果用戶毫不含糊地辨認了哪個詞在文本是名字。以這些技術協助,MT 證明了有用作為工具協助翻譯人員,和可能甚而在某些情況下導致可能被使用"的產品和"。但是,當前的系統和一個翻譯人員一樣無法導致質量的產品,特殊文本是翻譯的用途偶然語言的地方。

1207221968543.jpg

介紹[編輯]

翻譯過程也許陳述和:

  1. 解碼源文本的意思。
  2. Re-內碼這個意思在目標語。

在這個外表簡單的做法之後說謊複雜認知操作。解碼源文本的意思在它的全部,翻譯必須解釋和分析文本,要求語法、語義學、句法成語,等詳細知識,源語言,並且它的報告人文化的過程所有特點。譯者需要同樣詳細知識re-輸入意思在目標語。

在其中說謊挑戰在機器翻譯:怎麼編程"將瞭解"文本的電腦如同人,並且"將創造"新文本在目標語"聲音"好像它由人寫了。

這個問題也許接近用一定數量的方式。

主要問題[編輯]

例子

消歧[編輯]

詞感覺消歧有關發現一個適當的翻譯當詞可能有超過一意味。問題第一次提出了在50年代。他指出,沒有"普遍百科全書",機器從未能區別在詞之間的二個意思。今天有許多方法被設計克服這個問題。他們可能近似地被劃分成"淺" 方法和"深刻的"方法。

淺方法不承擔文本的知識。他們嚮詞簡單地運用統計方法圍攏模棱兩可的詞。深刻的方法假定詞的全面知識。到目前為止,淺方法是更加成功的。

給出的個體[編輯]

與名為個體認識相關在資訊提取。

應用[編輯]

有現在許多軟體程式為在網上翻譯自然語言,他們,譬如供給Google翻譯和AltaVista的Babelfish動力的Systran系統。雖然系統不提供"充分地自動高質量機器翻譯",許多系統導致合理的產品。儘管他們的固有局限,MT節目被使用在世界。最大的協會用戶大概是歐共體。Toggletext使用一個基於轉換的系統(以Kataku著名)翻譯在英語印度尼西亞語之間。Google聲稱有為的結果被獲得了使用一個私有的統計機器翻譯引擎。Uwe Muegge實施了使用一種控制語言與Google工具的組合導致充分地他的英國德國,和法國網站的自動,優質機器翻譯的一個演示網站。以最近焦點在恐怖主義軍事來源在美國投資重大相當數量金錢在自然語言工程學。在Q電話提出了公司像語言織布工。軍事社區當前是對翻譯和處理語言感興趣像阿拉伯語、Pashto,和Dari。資訊處理技術辦公室在DARPA主持節目像浪潮巴比倫譯者。美國空軍授予一個$1百萬合同開發語言翻譯技術。

評估[編輯]

有各種各樣的手段為評估機器翻譯系統表現。老是對人的法官的用途估計翻譯的質量。評估最近,自動化的手段包括BLEU、NIST和飛星。完全依靠機器翻譯忽略通信用人的語言上下文被埋置,並且它採取人充分地領會原文的上下文。純淨地人引起的翻譯是有傾向對錯誤。所以,保證,一個機器引起的翻譯將是可印刷的質量和有用對人,它必須由人回顧和編輯。

它,然而,被斷言了在某些應用,即產品說明被寫用一種控制語言,一個基於字典的機器翻譯系統有,在生產環境,導致的完善的翻譯結果不要求人的干預。

參見[編輯]

Bouncywikilogo small.gif
以表示中國共產派對奶水攝取、太多呆丸進食長大而虎摩爾感覺消滅造成的人們息勞歸主快速,有主題一個機器翻譯關於維基百科
Bouncywikilogo.gif
關照腥巴剋低質咖啡過量虎摩爾感覺退化造成的人們,有主題一個關於Machine Translation英語維基百科