搜索引擎与生疏词汇翻译
info@ecyti.com 4008-369-028 / +86 010 6415 5667 8:00 - 22:00
首页 > 新闻列表 > 搜索引擎与生疏词汇翻译

搜索引擎与生疏词汇翻译

词汇翻译
发布时间:2016-09-02作者:系统管理员

翻译工作者在长期翻译实践中,或多或少都会碰到自己生疏的词汇,如何翻译好这类词汇——至少达到公允的程度,不同的译者可能采用不同的方法,如翻字典、寻找平行语料、查阅背景知识、向专业人士请教等,或者综合运用多种方法,使得自己的译文尽可能贴近行家里手的水平。但不管采用上述何种词汇翻译方法,都要耗费大量时间,有时候可能为了某个词汇翻译推敲数天乃至数月。笔者在翻译《文学学生目录学导论》(An Introduction to Bibliography for Literary Students)过程中,大量使用搜索引擎来辅助翻译生疏词汇,同时也采用翻字典、查阅背景知识、向专业人士请教等方式,总结了一些方法与经验,在此谈谈使用搜索引擎翻译生疏词汇的得与失。

随着信息技术的发展,互联网如今能够提供数以万亿计的各种电子化数据,包括各类专业语料库、论文库、在线词典等。朱明炬、谢少华(2003:59)认为:“从某个角度来说,互联网便相当于一个免费的巨型的语料库,而搜索引擎便是进入这个巨型语料库的一把‘钥匙’。”翻译工作者一旦掌握好利用搜索引擎各种技巧,就能够便捷地利用到这个巨型语料库,给自己的翻译工作提供巨大便利。王勇(2005:28-30)认为通过搜索引擎,可以搜索参考文献,查找对应的译文,检验译文的准确地道;周杰(2007:62-65)则具体到查找网络在线词典,查找人名、地名、专有名词和术语的对应译法,查找新词的译法,查找或检验单词固定搭配或常用搭配。总体而言,这些对于搜索引擎与辅助翻译的研究比较笼统,虽然结合部分实例,但限于文章篇幅,只是从理论高度给出方向,但没有详细阐述如何利用搜索引擎来辅助翻译。笔者在前人对搜索引擎辅助翻译研究的基础上,结合自己的翻译实践,详细阐述各种搜索引擎技巧,提供各种实例,总结可为与不可为的情况,或给读者以提示何路可走,或给读者以警示何路不可走。

首先,我们来谈谈使用搜索引擎来辅助翻译笔者手头字典收录不到的词汇。这类词汇包括不常见的机构名称、人名地名、缩写词、拼写错误、早期英语单词、活字印刷早期拼写、原文中夹杂的外语单词等。我们先来看看笔者在翻译过程中碰到的一个例子:

In apaper entitled 'Bibliographical Problems with a few Solutions' in the Papers of the Bibliographical Society of America, vol. x, 1916, p. 128, Dr. GeorgeWatson Cole remarks that 'a collation by signatures, to be logical, should begin where the printer began his work and not with the preliminary leaves.

在这个例子中,对于Papers of the Bibliographical Society of America如何翻译,我们从字典查找不到。字典一般提供具体某个单词的不同意思,也提供一些固定搭配的翻译,但像这样七个单词组成的词汇,字典一般都无法提供具体翻译。那么在具体翻译处理时,译者一般只能够根据自己熟悉的语义进行翻译,这样一来,对于不同的译者,就可能会出现不同的翻译了,“papers”可能会翻译为“论文”、“论文集”,“bibliographical”可能会翻译为“书目”、“目录学”、“书志学”,“society”可能会翻译为“协会”、“学会”,而“America”可能会翻译为“美国”、“美洲”,这样的组合结果将会千奇百怪,千人千面。

使用搜索引擎辅助翻译机构名称,则能够直接找到对应翻译或缩小可能错译的范围。为了能够最快的检索出双语对照的语义,我们一般都是将“检索内容+译入语某个关键词”输入检索框内进行检索。如本次在google检索[“Bibliographical Society of America”+学会],共得到约13100条检索结果,可以获得“美国图书学会”、“美国书目学会”、“美国书目编制学会”、“美国目录学学会”等翻译内容,由于这一机构没有官方的中文名称,出现同一机构多个中文翻译名称的情况。具体原因在于google的收录内容没有进行筛分,导致各种语料杂烩在一起,良莠不分,这点是反对使用搜索引擎进行辅助翻译的人士极具力量的依据(倪传斌、郭鸿杰、赵勇,2003:53)。至此,我们对采用何种翻译,仍无法确定。但我们可以确定的是,在众多检索结果中,只存在“bibliographical”这个词出现了多个语义,而这个词就是我们整本书的核心,已经统一为“目录学”,则在此,我们可以初步判断该术语定义为“美国目录学学会”。为了验证这一定义,我们在google检索“美国目录学学会”,获得3条结果,分属两个不同的网页内容,均与西方目录学相关,应该视为公允的表达,则最终对这一机构名称的翻译,我们固定为“美国目录学学会”。

同样在这个例子中出现的人名,适用音译方法,就不能依赖于搜索引擎,而应遵从人名译名原则。对于“George Watson Cole”如何音译,如果将三个词同时放入google中,加上“人名”、“目录学”等中文关键词,都无法找到对应的音译。但如果将三个词分拆,则出现的音译就存在很大差异了。除了George这一中国人常见名称翻译为“乔治”外,Waston就有“华生”、“沃森”、“沃特森”等音译。“华生”是福尔摩斯侦探系列故事中让人印象深刻的角色,因此这一音译广为使用;“沃森”与“沃特森”是纯音译。同样,Cole也存在“科勒”、“科尔”等音译。在没有学界将同一名称统一为同一个音译之前,译者可以随意选择人名音译,并且某些特定音译在人名音译统一之前,已经在社会上产生了非常大影响。如《国富论》的作者Adam Smith至今仍沿用最初的音译“亚当·斯密”,而没有按照目前统一的音译为“亚当·史密斯”。“Watson”翻译为“华生”也属于此论。但在学界将人名音译规则确定后,就应该按照统一的音译规则来翻译人名。对于人名准确音译问题,搜索引擎无法提供帮助,甚至会出现极大的混乱,因为搜索引擎收录的各种音译未经过任何学术筛分,也没有全部遵从音译规则,一名多读或同名异音的例子屡见不鲜。为求汉语译名尽可能一致以方便使用,一般都采用“同名同译”的原则进行处理(新华社译名资料组,1997:说明)。目前国内学界比较一致的意见是采用新华社译名资料组编写的《英语姓名译名手册》所收录的译名来处理翻译过程中碰到的人名地名名称音译问题。则根据该手册,“George Watson Cole”对应的音译为“乔治·沃森·科尔”。

反过来,如果在英文中碰到了中国人名地名,再需要翻译到中文当中来,这时候任何字典与工具书都帮不上忙了,因为中国人名地名同一个发音,可能对应几个甚至十几个不同的汉字(词汇),而不同的汉字(词汇)均表达不同的意思,一旦译错,就可能出现笑话,如清华大学历史系副主任王奇所著《中俄国界东段学术史研究:中国、俄国、西方学者视野中的中俄国界东段问题》一书中,将蒋介石(采用韦氏拼音的原文为ChiangKai-shek)翻译为“常凯申”。要避免这种回译人名出错的问题,单单靠译者脑子里面的知识,着实是不够的。此时,如果借助搜索引擎,应该可以解决绝大部分这类问题。以笔者在一个关于人造草坪杂志文章的英译中案例为例,里面提到:“Mr. Chen Peng, the chief representative of TenCate Thiolon in China, said”。在这个例子中,笔者就碰到这样的难题:如何将“Chen Peng”准确翻译出来?为此,笔者确实费了一番功夫。在google中检索“Chen Peng”用处不大,因为中国发音为“Chen Peng”的人太多了。对此,我采用了一个迂回的做法。我先通过搜索引擎查找看看有没有TenCate Thiolon的中文网站,在第五个结果中幸运地找到了荷兰皇家昙卡草坪(亚洲)公司的网站(www.thiolon.cn),确认其官方名称。然后检索“荷兰皇家昙卡草坪(亚洲)公司+首席代表”,则在第二条检索结果中发现“昙卡赛尔隆(亚洲)公司北京办事处首席代表陈鹏讲述成功背后 ... 荷兰皇家昙卡集团是一家专业从事于化工材料及纺织领域的大型跨国公司,自1704年成立以来,至今 ...”,这条信息正是来自该公司的官方中文网站(www.thiolon.cn/info.aspx?n=20101201104337308185),至此,我就能够判断“Chen Peng”的准确翻译为“陈鹏”,而非“陈朋”、“辰芃”等常见的中文名字。

通过使用搜索引擎来辅助翻译机构名称,再通过人名音译规则来避免搜索引擎对人名音译鱼龙混杂的局面,我们最终将上面英文句子翻译如下:

乔治·沃森·科尔博士在《美国目录学学会论文集》一篇题为“目录学问题及部分解决方案”的论文(vol. x, 1916, p.128)中提到“通过折标来检查配页简介要合乎逻辑,则应从印刷商开始工作的地方开始折标,而非从正文前书页。

我们在翻译过程中,可能会碰到原文中拼写错误的单词或早期英语单词,翻字典一般都不能解决这类问题,有时候光凭自己经验,也无法知道具体拼写到底错在哪里。Google搜索引擎根据拼写错误出现频率,可以通过模糊查找方式,提供最可能接近正确的拼写,由译者结合上下文来判断该拼写是否符合文意。我在这本书的翻译过程中,就碰到出现早期英语单词的句子:

Another interesting cancel occurs in a book by Henry Howard, Earl of Northampton, A Defensative against the Poison of Supposed Prophesies, 1583, which was supposed tocontain treasonable matter.

对于这句话中出现的“defensative”这个单词,从陆谷孙主编的《英汉大辞典》中查找不到任何词源,但根据拼写规则来看,也不像是拼写错误,考虑到这是一本1583年出版的书籍,这个单词可能源自于早期英语,或者只是书籍出版年代所通行的单词形式。我们在google中检索“defensative”,马上就得到这样提示:“您是不是要找:Defensive”。我们再根据上下文进行判断,在这里defensative这个单词经过央音脱落,就等同于现在的defensive,意为“辩护”。理解了这个词,我们就好翻译这句话了,我们最终翻译为:

另外一个有意思的撤销发生于北安普顿伯爵亨利·霍华德的一本书《反对臆想预言毒害的辩护》(A Defensative against the Poisonof Supposed Prophesies, 1583),其中被认定含有叛逆内容。

另外一种拼写情况在当代英语出版物已经绝迹,但在十五六世纪的活字印刷作品中却非常普遍,即“u与v同时出现时,V一般大写,小写u用于单词中间位置,而小写v用于词首。因此,不管在什么情况下,除了词首之外,我们使用小写字母来替代大写V时,我们必须使用u。”例如,在书名出现单词“VINVM”时,我们要明白作者想表达的是“Vinum”或“vinum”(酒)。

上面的例子是直接利用搜索引擎提供的搜索结果来协助确定词汇的中文语义,下面,我们还可以采用搜索引擎检索到的许多免费在线专业字典,便于查找到缩写词的原型,便于译者理解,进而能够准确翻译出来。笔者在翻译过程中就碰到这样一个存在三个缩写词的句子:

Thereexist also a few MSS. which may have been prepared for the printer though not actually used. For example, in the MS. of R. Carew’s Excellency of the English Tongue now in Brit. Mus. Cotton Julius F. xi certain passages are underlined which in the printed text are in italics.

在这个句子中,“MSS.”、“MS.”与“Brit. Mus.”都是缩写词,在笔者翻译的这本书中,没有提供相应的缩写对照表。由于笔者是第一次接触目录学著作,对这些缩写词非常陌生,如果不知道这些缩写词的原型,整句话就无法理解,翻译时也不可能孤零零地将几个缩写词放在译文当中。此时借助搜索引擎,就能够便捷地解决笔者这一问题了。笔者先检索“MSS.abbreviation”,第三条检索结果就是一个网站链接“MSS - Definition by AcronymFinder”(www.acronymfinder.com/MSS.html),点击进入该网页,发现这是一个提供首字母缩写原词的免费在线字典网站,其中MSS缩写词的原型总计有139个,其中第一个就为manuscripts,与上下文文意相吻合,则可以根据manuscripts的语义,在此翻译为“一些手稿”。在该网站进行检索,发现“MS.”则是manuscript的缩写,翻译为“手稿”;“Brit. Mus.”为Britain Museum的缩写,翻译为“大英博物馆”。需要注意的是,虽然查阅陆谷孙主编的《英汉大词典》也能够单独找到这些缩写词对应的单个原词,但AcronymFinder网站所提供139个首字母缩写词定义,是纸质字典很难全部包括在内的,如Managed SecurityServices(安全托管服务)、Mobile Satellite Services(移动卫星服务)等,只能够通过搜索引擎才能获得满意的原型词了。通过上述准备工作,我们就能够理解全文,将这个句子翻译如下:

也存在一些手稿已经由印刷商准备好了,但实际上却没有使用到。例如,R·卡鲁《英语语言的优越性》(Excellency of the English Tongue)手稿现在保存在大英博物馆当中(编号为“CottonJulius F. xi”),其中某些片段加下划线,这在印刷文本中则是斜体字。

搜索引擎一方面可以检索到许多对译者有用的在线免费资源,另一方面,搜索引擎利用自身收录资源的优势,还提供在线翻译功能,对于英语及其它西方语言之间的互译,能够提供比较让人满意的机器翻译质量。

由于西方国家彼此临近,社会交往密切;西方语言基本上源自于印欧语系,并且各国文字在语音、词形、词义、语法等方面也存在很多共通之处,一个作家可能会掌握两种以上语言,在其作品中,就可能会引用到英语之外的语言,如法语、意大利语、拉丁语等。译者不大可能都熟悉掌握跟原作者一样的外语。笔者在本次翻译过程中,就碰到作者在英文中使用外语词汇或插入语的句子:

Let us take the title-page of the translation of Cornelius Agrippa's treatise, De Incertitudine et Vanitate Scienti-arum et Artium, by James Sandford,1569.

笔者除了学习第一外语——英语之外,没有学习过任何第二外语,弄不清楚这个句子出现的“De Incertitudine et Vanitate Scientiarum et Artium”究竟属于哪国语言,想快速找一个懂得这一语言的人士协助翻译一下,也成为问题。此时,笔者充分利用了google搜索引擎提供的在线翻译(google translate)来理解这些外语词汇。基于统计学的google translate机器翻译网罗了大量西方语言相互之间的双语对齐语料,加上西方语言之间的相似性比较高,因此能够实现比较可靠的机器翻译,将其它西方语言翻译为英语,其翻译质量基本上可以接受。下面笔者就以“De Incertitudine et Vanitate Scientiarum et Artium”为例,谈谈利用在线翻译这一资源的体会。

我在translate.google.cn原文框中输入待译内容,将源语言选择为“检测语言”,目标语言选择为“英语”,然后点击“翻译”,马上就得到如下结果:

从这一结果中,我们首先可以判断源语言为拉丁语。如果我们对google translate的翻译结果存在疑问的话,我们至少可以准确地去找熟悉拉丁语的人士或查找拉丁文字典获得相应的语义翻译。在本次翻译中,笔者没有找到拉丁语专业人士进行咨询,而是通过搜索引擎对于google translate提供的英文翻译进行进一步验证。笔者的方法是,将作者名字Cornelius Agrippa与Theuncertainty and vanity of Arts and Sciences一起进行检索,发现这两对关键词是匹配出现的,只是在the uncertainty前面还多“on”或“of”,因此,可以确定这个拉丁文书名“De Incertitudine et Vanitate Scientiarum et Artium”在英语中对应的公认表达就是“On the Uncertainty and Vanity of Artsand Sciences”或“Of the Uncertainty and Vanity of Arts and Sciences”。英语是笔者熟悉的外语,则很容易就可以翻译为“论艺术与科学的虚无性与不确定性”,另外,还可以通过检索作者姓名与“论艺术与科学的虚无性与不确定性”进一步验证这一翻译的正确性。搞清楚外语词汇的翻译,这句话我们也就可以准确翻译出来了:

我们来看看科尼利厄斯·阿格里帕的专著《论艺术与科学的虚无性与不确定性》(De Incertitudine et VanitateScientiarum et Artium,詹姆斯·斯坦德1569年译)译文版书名页。

上文谈到的都是笔者手头字典收录不到的词汇,接下来,我们再来谈谈signature、signed、unsigned、gathering这类字典中提供诸多语义的单词。对于这类单词,如何通过搜索引擎找到上下文,确定多义词的在本书语境中的专业表述。以signature为例,陆谷孙主编的《英汉大辞典》专门就印刷学给出了专门的翻译:“7.【印】书贴(只依页码次序可折成一叠的印有数页书页的大张纸或将其折成的一叠,合并若干叠装订成书);折标(只印在书帖首页下部指示装订的字母等标记)”。(陆谷孙,2007:1865)一个词在同一个专业给出了两个语义,我们该如何判断呢?

我们看看signature在书中出现的上下文位置,在两个不同的句子中,这两个语义可能都说得通:

Itmight be useful if some sign never occurring in early books could be adopted tostand for any signature. 在这个句子中,“signature”翻译为“书帖”是说得通,如果不考虑上下文,大体意思就是“如果某个符号在早期书籍从来就没有出现过,则可以用来代表任何书帖,这点可能非常有用。”

我再看看另外一个句子:“For this purpose I have suggested the use of the Greek letter π, which perhaps never, and certainly very seldom, occurs as an actual signature of preliminaries, and which, as being already used for something else to which no exact value can be assigned, and being easily recalled by the p of'preliminary', seems specially suitable.”这里明显提到希腊字母π,则这个位置可能需要翻译为“折标”。

我们可以简单判断一下,作者在本书的写作过程中,signature是出现非常频繁的一个单词,应该有准确、唯一的定义,因此,对于这两个语义如何选择,我们需要借助搜索引擎。笔者分别检索“signature + 书帖”和“signature +折标”,发现两种检索结果都超过百万条,无法通过搜索词频来区分具体用法。对于印刷知识不多的笔者而言,如何区分这两个词呢?如果我们借助搜索引擎能够找到这两种表述的区别或联系,则我们就能够很好地了解基本背景知识,有利于我们进一步对两个语义进行区分。笔者在google上直接检索“书帖+折标”,就可以得到很多同时含有“书帖”与“折标”的网页。第一条检索结果是一条百科知识,提到“折标设置折标是按每帖书页装订前后顺序不同,在书帖背部或天头(地 ... (2)骑马订书刊一般要2帖以上才印折标,折标应拼在书帖天头(地脚)处。”第八条检索结果是关于“书帖”定义的百科知识:“书帖(signature),是指将印张按号码排列顺序,折成一叠多张页。将印刷好的页张(切开或不切开),按页码及版面顺序,折成数折后,成为多张页的一沓后称为书帖。一切大幅面的页张都要制成书帖后才能进行下工序的装订成册的加工。印刷完成后的整张书刊正文页,经过断裁,按页码顺序折叠成与书刊开数一致的帖,故名‘书帖’。书帖外面书背上印有书帖顺序,称为帖码;从上到下放置的黑方块称为折标。帖码和折标是防止配页时出现错误而印在书帖上的。”通过查阅这些背景知识,极大地丰富了辞典提供的语义的外延。

另外,如果能够通过搜索引擎找到signature两个不同语义的英文定义,则能够大大提高我们的理解能力。我们检索“signature+ definition + printing”则发现多个在线字典对signature的具体英文定义,其中第一条结果的英文定义翻译成中文就是《英汉大辞典》的定义;第三条检索结果(http://www.businessdictionary.com/definition/signature.html)为“4.Printing: Sheet of printed paperthat is folded one or more timesto become a single unitof several pages in multiples of 4, such as an 8-page, 12-page, 16-page signature.Signatures are collected in their proper sequence (called 'gathering'), boundor sewn, and trimmed to producethe finished publication.Its name comes from the old practiceof placing a mark on the first (top) page to guide the gatherer.”至此,我们明白了signature的语义,先从折标(amark on the first (top) page)而来,进而表述为由同一个折标下的书页构成的一叠。

结合上下文,我们判定在本书中,signature应该翻译为“折标”,而非书帖。同样从上述在线字典的定义,我们发现与书帖类似定义的一叠纸张,称之“gathering”,我们查《英汉大辞典》发现“gathering”的定义为:“8.【印】配页,排书;订成书帖的书页”(陆谷孙,2007:769),则选择其语义为“配页”,signed则是signature的动词过去分词形式,也翻译为“折标”,与之对应的“unsigned”则翻译为“无折标”。至此,上述两个句子可以翻译如下:

第一句翻译为:“如果某个标记在早期书籍从来就没有出现过,则可以用来代表任何折标,这点可能非常有用。”

第二句则翻译为:“对于这种情况,我建议采用希腊字母π,这个字母在正文前书页中可能从来没有,用作实际折标肯定非常罕见,已经用于别的方面也不表示精确值,并且容易让人想起正文前书页preliminary中的首字母p,这看起来非常适合。”

最后,我们再来谈谈借助搜索引擎来查找多单词组合词汇的语义——字典往往无法提供这些多单词组合词汇的语义,但通过搜索引擎可以查找到别人对多单词组合的翻译,具有一定的借鉴意义,最终需要结合上下文对相关语义进行验证。我们用最后一个句子来看看搜索引擎在这方面给我提供的帮助:

This isobviously only possible when the whole title is in type of the same size (only usual in quite early work), for in what units shall we measure the space occurring between, say, a line of english and a line of long primer?

“a line of english”与“a line of long primer”对于笔者而言,每个单词都很熟悉,但组合在一起,就很难了解具体的意思了。尤其是english这个单词,平时出现表示“英语、英国的”这类语义时,首字母都是大写,而在此处为小写,另外,根据上下文,此处也不大可能表示“英语、英国的”这类语义,那么,是否存在更为专业的语义呢?如何找到这个非常熟悉的单词,背后存在的专业语义呢?

此时,笔者需要查找必要的背景知识,搜索引擎给笔者提供的帮助应该是最大的。根据文意,这两个单词组合大体谈的应该跟“字体”(type)有关,就是要衡量在两种东西之间间距(space occurring between)的单位问题。“a line of”的语义比较具体,不存在歧义,但“english”与“long primer”这两个具有实际意义的词汇该如何翻译,直接就影响到对整句话的理解。笔者采用猜测检索方法,事先认定english与字体有关,采用双语关键词在搜索引擎中检索“english +字体”,前面三页检索到的结果都只是英文字体内容,找不到相关线索。根据笔者的经验,如果前面三页都没有找到与我们文意相关的任何蛛丝马迹,则意味着我们选择的关键字不恰当,需要变更检索的关键词。这次我们检索“long primer +字体”,第九个结果给我们一点提示“中文:12点,派卡pica. 中文:11点small pica. 中文:10点long primer ...”。有可能long primer就是10点。则我们需要进一步验证,检索“long primer +10点”,获得的结果让笔者豁然开朗。“10点[西文活字] long primer;11点[西文活字] small pica;12点[西文活字],派卡[字号单位] pica;12点活字[西文] pica type;12点活字的全身[西文],全身派卡 picaem;14点活字[西文] english;14点活字[西文],英体活版铅字English type…”。点击到具体网页来看,发现这里面谈的都是英文字号问题。进而也纠正了我们之前对“type”翻译为“字体”的错误理解,而应该翻译为“字号”。由此,我们可以判定“a line of english”为“十四点活字行”,“a line of long primer”为“十点活字行”。则译文整理为:

显而易见,当整个书名使用同一号字号时(只在早期著作中比较常见),这种方法才可行,