您好,欢迎来到北京著文翻译有限责任公司!

您的位置: 首页 > 新闻资讯 > 万能宝典《圣经》可完善翻译算法

万能宝典《圣经》可完善翻译算法

发布者:著文翻译公司 发布时间:2018-10-26 23:45 浏览:61

【摘要】为了改进计算机文本翻译,达特茅斯学院的研究人员转向《圣经》寻求灵感,结果发现以不同版本的《圣经》为基础的算法可针对不同读者,将书面文本转化成不同的风格。

2.jpg

为了改进计算机文本翻译,达特茅斯学院的研究人员转向《圣经》寻求灵感,结果发现以不同版本的《圣经》为基础的算法可针对不同读者,将书面文本转化成不同的风格。

达特茅斯学院的研究团队认为,《圣经》不仅是世界人民的精神向导,还是一个“尚未开发的大型对齐平行文本数据库”。除了提供无限的灵感之外,《圣经》的每个版本都包含超过31,000节经文,研究人员用这些经文生成超过150万个源经文和目标经文的独特语对。

根据研究,这不是第一个为研究风格翻译而创建的平行数据库,但是第一个以《圣经》为文本创建的平行数据库。过去使用的文本涵盖了从莎士比亚作品到维基百科条目等各种各样的文本内容,但其提供的数据库要么太小,要么不适用于研究风格翻译。

“由于英文版《圣经》有许多不同的书面风格,因此成为研究风格翻译的完美源文本,”研究人员基思卡尔森说。

对研究团队来说,《圣经》的另一优势是可以通过书籍,章节和诗节编号进行索引。这种跨文本预测组织消除了不同版本的同一文本在对齐时发生错误的风险。

“圣经是一个‘神圣的’数据库,可以用来研究这项任务,”达特茅斯学院计算机科学教授丹尼尔洛克莫尔说,“几个世纪以来,人类一直在整理圣经文本,因此我们不必迷信不太可靠的对齐算法。””

在研究中,为了定义“风格”,研究人员参考了句子长度,被动或主动语态的使用,以及单词选择等因素。该研究称:“不同的措辞传达的礼貌程度不同,表现的与读者的距离也不同,还会显示作者的文化信息。””

该团队采用了34种风格独特的圣经版本,从“詹姆斯国王版圣经”到“基础英语圣经”,语言复杂程度各不相同。这些文本被输入两种算法:一种是被称为“摩西”的统计机器翻译系统,另一种是常用于机器翻译的神经网络框架“用于机器翻译的神。

虽然使用了不同版本的圣经来编写计算机代码,但最终可以开发出针对不同受众的文本风格翻译系统。例如,利用风格翻译系统,可以将《白鲸》选段翻译成适合年轻读者、非英语母语人士或各种受众群体的译文文本。

“文本简化只是风格转化的一种特定形式,更广泛地说,我们的系统旨在生成与原文具有相同含义的文本,只不过是用不同的文字进行,”卡尔森说。

分享到:

您也可以在线提交您的需求,客服人员将会第一时间与您取得联系

Copyright © 2015 Ecyti Trans 北京著文翻译有限责任公司 保留一切权利 京ICP备15019212号