繁简转换

本页使用了标题或全文手工转换,现处于香港繁体模式
求聞百科,共筆求聞

繁简轉換,或简繁轉換,指繁体字簡體字的互相轉換,實際使用時通常包括台灣香港澳門中國大陸新加坡馬來西亞地區所使用的標準中文之中不同字、詞的相互轉換。由於中國大陸漢字簡化並非全部採用「一對一」方式,有部分用字採用「一對多」方式,因此準確的漢字轉換相當困難。目前已經有相當多的專業人士正利用各種方法解決這個難題。

需求和難點

很多國際性公司和機構都需要將重要的外文文字同時翻譯為簡體中文和繁體中文,而許多重要中文文档往往一經寫出,就要求同時發佈簡體中文版和繁體中文版。這些轉換需求中最常見的是多語軟件、多語網站和一些面向多語用戶的重要國際性文档。同時生成、發佈簡體版和繁體文档最直接也最常見的方法就是先編寫簡體中文版或繁體中文版,然後再通過简繁轉換或繁简轉換,生成與之相對應的繁體版或簡體版。

由於簡體字和繁体字在許多語言表達的細節上有差異。例如:簡體中文中的「服务器」,在繁體中文中的專業寫法是「伺服器」,簡體中文中的「圆珠笔」,在繁體中文中多用「原子笔」,簡體中文裏的「斯大林」在台灣被稱為「斯大林」,簡體中文裏的「朝鲜」〔此處特指平壤政權〕在繁體中文裏常被稱為「北韩」,簡體中文裏的「悉尼」在台灣被稱為「雪梨」(澳大利亞城市),著名的RPG遊戲軟件Final Fantasy,在中國大陸一般譯為「最终幻想」,而在香港、台灣舊譯為「太空战士」。

簡單轉換和專業轉換

電腦專業人員,通過電腦軟件對繁简字作對應處理,雖然在技術上逐漸完善,但最專業的轉換,往往仍需求人工參與。根據轉換專業程度上的差異,简繁轉換大致可分為簡單的「字對字」轉換、經部分修正的简繁轉換和高度專業的專業性简繁轉換。

字對字相互轉換

方法

就是簡單地將每個簡體字轉換為對應的繁体字。网络上可以找到大量的免費軟件、網站和轉換代碼,他們做的一般都是字對字的簡單轉換,或在字對字轉換基礎上加上很少的修訂。

效果/作用

大部分所謂的繁简轉換都只能作「一對一」轉換,常見的有「发」對「发」,但「发」則無法轉換成「髮」。

只能用於非正式資料的資料級轉換,大多數情況下目標語用戶能看懂。但由於在地域上詞彙用語的差異,經常容易讓目標地區的讀者產生理解上的困難。轉換品質相當弱。如果一位簡體中文用戶看見下面的句子,即使大致句子結構能看懂,但在句子意思上則難以解讀。

例句:

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布希

字對字的繁简轉換結果:

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布希

簡體中文中的正確說法:

  • 他用调制解调器发出一个回车字符
  • 贝克汉姆老挝见到了布什

詞對詞相互轉換

能正確判別「头发」應對應至「头髮」而非「头发」,「喷发」應對應至「喷发」而非「喷髮」。

地區用語轉換

方法

典型的例子是Google翻譯中以簡體中文和简繁中文為目標語的翻譯和Microsoft WordExcel中的简繁轉換功能。其中Google翻譯中的修訂僅限於字級別上的修訂,而Microsoft Word的轉換品質相對較好,作了很多修訂,不過轉換結果中仍可以找到大量未修訂,不符合目標語表達習慣的地方。

效果/作用

Google只做了字級的基礎修正,如簡體中文中「头发」和「发现」/「发生」中的「发」是一個字,但在繁體中這兩個發不一樣(「头髮」、「发现」/「发生」),Google對大多數這類情況進行了適當的修訂,但Google並未進行詞級上的修訂,如從簡體中文的「软件」、「服务器」譯入繁體中文時,Google只是譯為「軟件」、「服务器」,並未根據繁體表達習慣,譯為「软件」、「伺服器」。

而Word(以及Bing翻譯)在詞級上作了一些修正,可以讓目標語的用戶感覺親切一些,但如果細究起來,Word的轉換結果在很多地方與真正的目標語表達習慣仍有相當明顯的差距。

再看前面提到的句子,

  • 他用数据机发出一个归位字元
  • 碧咸老挝见到了布殊

用Word對上面的初始繁體中文句子做繁轉簡後,結果如下:

  • 他用调制解调器发出一个归位字符
  • 碧咸老挝见到了布殊

而如用Word對上面的初始簡體中文句子做簡轉繁後,結果如下:

  • 他用数据机发出一个回车字元
  • 贝克汉姆老挝见到了布希

參見