本文系作者崔启亮老师授权转载,本文在简要介绍本地化服务特征和翻译技术研究成果的基础上,对翻译技术下了定义,分析了翻译技术与翻译工具的关系,提出了本地化服务的翻译技术与工具的选择策略,重点论述翻译技术和工具在本地化工程分析、预处理、翻译、后处理的应用,总结了本地化服务技术驱动的特征,提出了翻译技术是本地化服务竞争力要素的观点。更多翻译技术和本地化的干货信息,请回复“本地化”至译匠公众号查看更多。
前言
本地化是将一个产品按特定国家/地区或语言市场的需要进行加工,使之满足特定市场上的用户对语言和文化的特殊要求的生产活动。作为语言服务业的核心组成部分,本地化行业从1990年本地化行业标准协会(LISA)成立以来,市场规模和影响力迅速扩张。早期的本地化服务的需求来自跨国软件公司,例如IBM和微软。随着经济全球化的发展,垂直行业的跨国公司产品的本地化需求不断增加,例如汽车、金融、能源、工程机械、航空航天、生命科学等领域。
本地化服务是信息技术驱动的语言服务。本地化的对象最早来自软件本地化,本地化的对象为多种格式的电子化文件,本地化服务提供商必须掌握软件工程技术和语言处理技术才能完成本地化服务。随着信息通信技术和翻译技术的快速发展,翻译技术在本地化服务中的应用范围越来越广。特别是面对多语种、多格式、大批量、专业化、高质量、时间紧的跨国公司产品本地化要求,使用信息技术和翻译技术不仅可以提高本地化服务的效率,而且还能提高本地化的质量。
翻译技术是翻译学的组成部分,国内外学者和本地化公司的专业人士已经对本地化服务所使用的翻译技术进行了研究,既专注于计算机辅助翻译(CAT)技术的专业研究,又从教学角度探讨翻译技术教学,或者描述本地化项目的具体技术应用。本文将从本地化服务行业的宏观视角切入研究问题,从本地化服务的中观视角探讨翻译技术、翻译工具的类型,翻译技术与翻译工具之间的关系,从本地化服务实施的微观视角描写翻译技术与工具在本地化服务中的应用。
1. 翻译技术与工具分类及选择策略
什么是翻译技术?什么是翻译工具?翻译技术与翻译工具之间是什么关系?翻译技术包括哪些内容?厘清这些概念有利于本地化教学的内容设置,选择适当的教学方法,有利于本地化服务实践,选择合理的本地化翻译技术策略。
1.1 翻译技术与工具的分类
目前学者对翻译技术和工具的定义和分类各不相同,甚至将翻译技术与翻译工具没有明确的区分。例如,鲍克(Bowker)认为翻译技术是人工翻译、机器翻译、计算机辅助翻译使用的不同类型的技术,包括文字处理和电子资源等通用工具,也包括语料库分析工具和术语管理系统等特定翻译工具。
在2014年编辑出版的The Routledge Encyclopedia of Translation Technology 中指出,翻译技术包括计算机辅助翻译技术和机器翻译技术。Quah将翻译技术划分为机助人译、人助机译、计算机辅助翻译和全自动化高质量机器翻译四种技术。翻译自动化用户协会(TAUS)将翻译技术分为翻译记忆技术、机器翻译技术、术语管理翻译技术、翻译项目管理技术和质量保证技术。
张霄军、贺莺将翻译技术分为机器翻译、译后编辑、云翻译技术和本地化四种技术。徐彬将翻译技术分为高级文字处理技巧、数字文本获取技术、输入技术、搜索技术、语料检索、术语技术、计算机辅助翻译技术、翻译项目管理技术。华树将翻译技术分为"译前""译中"和"译后"三个方面的技术,细分为源文档撰写与质量控制、可译资源提取及工作量估算、项目和工作流创建、预翻译、术语抽取及术语库创建、翻译记忆复用、术语识别、搜索与验证、译后编辑、质量保证、本地化排版、本地化编译、本地化测试、语言资产管理。
为了便于翻译技术教学和本地化服务实践,根据翻译技术的内涵和特征,笔者认为将翻译技术定义为翻译实践、翻译研究和翻译教学中应用的软件、工具、设施、环境、技巧等的集合。翻译技术一般包括翻译记忆技术、机器翻译技术、翻译中的术语技术、字符和语音识别技术、文件解析技术、译文质量保证技术等。
从内容和外在属性分析,翻译技术与翻译工具不是并列或等同的关系。翻译技术是翻译工具的根基,翻译工具是根据翻译技术开发的具体软件。一个翻译技术可以开发出多种翻译工具,每个翻译工具的工作原理是一种或多种翻译技术的内在支撑。例如,根据翻译记忆(Translation Memory, TM)技术,市场上已经开发出且Trados Studio、Wordfast、memoQ等翻译工具。且Trados Studio作为一种翻译工具,内部是依据翻译记忆技术、文件解析技术、质量保证技术等多项翻译技术而成的。
1.2本地化翻译技术与工具选择策略
随着信息技术的快速发展,翻译技术也在不断进步,翻译工具种类和数量不断增加。经济全球化促进了产品和服务的本地化,随着市场竞争的加剧,合理使用翻译技术和工具,可以提高产品本地化的效率,降低本地化成本。但由于需要本地化的产品种类多样化,产品本地化语种的多样化,产品本地化服务类型的多样化,如何选择合适的本地化翻译技术和工具,是本地化人士需要思考的策略之一。根据业界实践和学界研究,作者提出了如下翻译技术与工具选择策略。
1.2.1基于本地化对象特征的选择策略
对于软件、游戏等产品的用户界面内容,由于屏幕尺寸对文字长度有空间限制,而且文本简短和碎片化,宜选用支持可视化翻译技术的软件本地化工具。例如,Alchemy Catalyst、SDL Passolo等,翻译人员在翻译过程中可以直观地预览翻译后的译文在产品运行时的位置和显示等信息,将本地化用户界面的位置和误译等问题在翻译阶段即可避免或者降低。
1.2.2基于本地化质量要求的选择策略
对于软件、游戏等产品的联机帮助文件,属于信息型文本,采用了受控语言写作,句式较为简单,而且用户只是在需要时才查询相关内容,对文本译文质量要求达意即可,宜选用"翻译记忆"+"机器翻译"+"译后编辑"的策略,以获得效率和质量的平衡。而对本地化产品市场推广材料,不仅要求含义准确,而且句式优美,促使潜在用户购买,宜选择创造性翻译(创译,Transcreative)策略,采取人工翻译的方式。
1.2.3基于组织本地化能力的选择策略
根据组织(公司、部门)的本地化能力(团队人员数量、技能、经验),结合本地化对象的特征和要求,选择适合组织本地化能力的技术与工具。对本地化服务公司而言,如果客户有具体要求,则优先使用客户要求的翻译技术和工具。如果客户没有要求,优先选择组织已经拥有的技术和工具,或者选择组织内部可以快速学习和掌握的本地化技术与工具。
1.2.4基于功能与市场相结合的选择策略
如果组织内部没有现成的本地化工具,需要购买或开发新技术和新工具时,既要考察工具的功能、易用性、兼容性,也要考察工具开发商的市场地位、服务能力、价格水平。一些软件功能强大,但是易用性很差,价格很高,可能并不适合当前本地化的需要。选择最适合组织的本地化技术和工具,而不是选择最先进、最昂贵的技术与工具。
2.本地化服务中的翻译技术与工具
本地化服务范围是动态发展的,典型的本地化服务包括软件本地化、游戏本地化、多媒体本地化、移动应用程序本地化、桌面排版、项目管理等。
在产品本地化过程中,翻译是本地化的核心任务之一,为了更好地完成翻译任务,从技术方面来说,通常需要进行本地化工程分析(Engineering analysis)、预处理(Pre-process),翻译任务完成后,要进行后处理(Post-process)。下面以软件本地化为例,以本地化翻译为焦点,论述本地化服务中本地化工程分析、预处理、翻译、后处理等本地化流程中翻译技术与工具的应用。
2.1本地化工程分析的技术与工具
本地化工程分析是根据项目需求和范围,在为后续的本地化翻译工作做准备的同时,将工程技术工作分解成工作活动,并按工作活动评估工作量大小的一组工作。本地化工程分析的主要目的是:从技术上分析本地化的可行性,制定本地化技术策略,确定本地化包(包括本地化文件集、本地化指南、本地化工具、本地化参考材料等)。
本地化工程分析的技术主要包括提取本地化资源文件的技术、文本字符统计技术。软件本地化工程分析使用的工具与编程语言和编程环境有关。如果软件的国际化设计良好,本地化资源文件可以在软件开发过程中将资源文件与软件代码隔离和独立。如果软件的国际化设计不良,则需要单独编写从软件代码提取软件资源文件的工具。为了便于软件工程分析,合理地完成工程任务分解(WBS),制定本地化工程项目进度表,可以使用Microsoft Project 软件。统计字数的工具很多,例如SDL Trados、memoQ、Wordfast等CAT工具,都具有文件字数统计功能,而且可提供文件文本内容与翻译记忆库的匹配信息。
2.2本地化预处理的技术与工具
本地化预处理的目的是向翻译人员提供方便翻译的文件包,预处理的文件对象是软件的用户界面资源文件、软件联机帮助、用户手册、市场材料等。预处理的工作内容主要包括:文件格式转换、文本提取、文本标注、译文文本的重复使用。
预处理的技术包括光学字符识别技术(OCR)、文本提取(Extract)、文本标注(Markup)技术和翻译记忆(Translation Memory)技术,每种技术都可以选择多种工具完成相应的工作,下面介绍本地化预处理中的技术和工具。
光学字符识别技术是通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。例如,为了翻译PDF文件,可以使用Abbyy FineReader、Solid Converter等工具,将PDF文件转换成DOC文件。
文本提取包括四个方面的技术:(1)从可以本地化的文件中使用软件将需要本地化的文本提取出来,如从视频或音频文件中将语音转化为文本,在各种语音识别工具当中,国内科大讯飞的语音识别工具较有影响力;(2)将图像中的文字提取出来,如使用且Text Catalo Tools抽取FLA文件中的文字。将Adobe Photoshop设计的PSD格式图像文件中的文字转换成TXT格式,需要开发或选择定制的工具;(3)将包含重复句段的句子从一批文件中提取出来,如使用SDL Trados Studio、memoQ等计算机辅助翻译工具;(4)将文件中的术语文本提取出来,如使用SDL MultiTerm Extract。
文本标注包括三个方面的技术:(1)采用软件将文件中不需要翻译的文本进行样式转换,如将不需要翻译的标签(Tag)变成隐藏格式,可以使用SDL Trados将HTML、XML等文件中的标签隐藏,也可以通过编写Word的宏对文件的标签进行转换,如将标签转换为twin4External样式。(2)将需要翻译文件的术语译文插入到文件中,可以使用"火云译客"的"术语标注"工具。(3)将翻译过程中需要特别处理的文本添加注释文字,如使用SDL Trados、Passolo、Alchemy Catalyst等工具,都具有添加注释的功能。
译文的重复使用(Leverage)是将以前已经翻译的内容导入需要翻译的文件中,保持译文的一致性、准确性,减少翻译工作量,降低成本,缩短翻译时间。翻译记忆技术是译文重复使用的最主要技术,通过翻译记忆软件将以前翻译过的译文从翻译记忆库中自动提取出来,插入到当前译文中。翻译记忆技术是计算机辅助翻译软件的核心技术之一,如SDL Trados、Alchemy Catalyst、memoQ、Wordfast、VisualTran、Transmate等,都是支持翻译记忆技术的计算机辅助翻译工具。
预处理阶段还可能用到的技术包括语料对齐技术,将以前翻译过的源文和译文分割成多个翻译单元,导出为翻译记忆库文件,供预处理使用。对齐工具可以是CAT软件内部嵌入的(如SDL Trados带有对齐工具WinAlign),也有独立运行的(如Transmate语料对齐工具)。
2.3本地化翻译技术与工具
本地化翻译执行过程中使用的翻译技术包括可视化翻译技术、翻译记忆技术、机器翻译技术、术语管理翻译技术、质量保证技术。
可视化翻译技术使得译者可以在翻译软件的用户界面(UI)文本时,实时看到翻译的原文和译文在软件运行时的语境信息(位置、类型等),避免翻译的"黑盒困境"。当前软件本地化翻译工具都具有可视化翻译功能,如Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等。图1是使用Alchemy Catalyst翻译某Windows应用软件的对话框中的按钮"OK",由于译者看到"OK"是对话框中的按钮的文本,就可以确定将其翻译为"确定"。
图1 Alchemy Catalyst软件可视化翻译软件对话框的文本
翻译记忆技术使得译者可以重复利用之前翻译的内容,动态更新翻译记忆库的内容,保持翻译的准确性,提高翻译的效率。翻译过程中使用的翻译记忆工具包括商业化的工具,如SDL Trados、STAR Transit、Kilgray MemoQ、Wordfast、Dejavu、Alchemy Catalyst、SDL Passolo、Microsoft LocStudion等,也包括开源的工具,如OmegaT。
机器翻译技术可以快速获得译文,为后续的译后编辑提供处理对象,提高翻译效率,满足客户对信息获取的即时要求。机器翻译工具可以分为独立式和嵌入式两种。独立式机器翻译是独立运行的系统;嵌入式机器翻译是通过开放应用程序接口(API),在计算机辅助翻译工具中调用机器翻译系统的译文,如SDL Trados、Kilgray MemoQ都集成了调用机器翻译API的功能。
术语管理技术使译者有效地完成术语的抽取、翻译、修改、存储、传输等工作。术语是本地化翻译需要重视的内容,在翻译过程中,译者在句段(Segment)级别借助术语管理工具动态,获得当前句段的术语及译文,并且可以方便插入当前译文中。在翻译过程中可以随时将新术语和译文添加到术语数据库中。本地化翻译的术语工具较多,分为独立式和集成式两种。独立式术语工具是单独安装和运行的术语管理工具,在翻译过程中可以与计算机辅助翻译工具配合使用,如SDL MultiTerm。集成式术语工具是将术语管理的功能与翻译记忆功能合二为一,成为计算机辅助翻译工具的功能之一,如Wordfast、Dejavu、memoQ都是把翻译记忆和术语管理功能集成在一个软件中。
质量保证技术提高了译文质量评测的客观性、一致性和效率,可以预防本地化的缺陷,改进本地化过程。使用质量保证工具可以在翻译过程中和翻译完成后自动化地获得译文中的错误和警告信息,包括漏译、翻译不一致、格式错误等。本地化翻译中的质量保证工具包括独立式和集成式两种。独立式质量保证工具包括ApSIC Xbench、D.O.G. ErrorSpy、Yamagata QA Distiller、Palex Verifika等。集成式质量保证工具将译文质量检查功能集成在计算机辅助翻译工具中,如Trados、Wordfast、Dejavu、memoQ都具有质量保证功能。
在本地化翻译过程中,为了提高翻译效率,还可能使用句段翻译状态过滤功能,例如只显示未翻译的句段,或者只显示已经审校的句段。为了加快翻译时的键入速度,有些软件支持自动提示(AutoSuggest)功能,例如译者在输入了 "Inter" 后,在输入位置软件会自动提示 "International" 和 "Internationalization" 等列表,供译者快速选词,SDL Trados工具具有这些功能。
2.4本地化后处理的技术与工具
本地化后处理的目的是将翻译人员完成的翻译文件进行处理,提供符合本地化要求的目标语言的文件,并且生成本地化产品的过程。后处理的文件对象是本地化的软件用户界面资源文件、软件联机帮助、用户手册、市场材料等。软件本地化后处理的工作内容主要包括:格式验证、控件调整、提取译文、文件格式转换、版本编译、软件测试、修正缺陷等。
本地化后的文字可能比源语言文字长度增加(字符扩展),通常一个英文单词翻译成1.7个汉字,所以,翻译后的软件用户界面文字可能因空间尺寸或位置问题,无法完整显示。格式验证是对本地化翻译后的文件进行格式检查和修改。常用的格式验证工具包括Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等,这些软件可自动验证本地化翻译过程中引入的各种错误,例如,热键重复、热键丢失、空间重叠、空间文本显示不完整、译文不一致。图2是使用Alchemy Catalyst工具的"Validate Expert"功能对本地化文件中的"Export Image Setup"对话框控件进行验证,显示在"Result"窗口中的验证,结果发现了以下错误:(1)翻译后丢失了热键;(2)控件文本被截断(控件文字显示不完整);(3)控件重叠。
图2 Alchemy Catalyst的"Validate Expert"的验证结果窗口
控件调整是借助可视化软件本地化工具(如Alchemy Catalyst)对验证发现的控件大小和位置错误进行修改的过程。例如图2中的控件被截断、控件重叠等错误,可以手工调整控件的尺寸大小和位置,使控件以正确的方式显示。
提取译文是使用计算机辅助翻译工具将双语文件导出为译文文件的工作,根据使用的工具不同,执行各自的提取工作,Alchemy Catalyst、SDL Passolo、Microsoft LocStudio、SDL Trados等软件都可以提取或导出为目标语言文件。
提取的本地化文件,如果预处理时进行了格式转换,则后处理需要再次进行格式转换,还原为原来的文件格式。如将DvC文件转换为PDF文件。将预处理中提取的文本翻译后,使用特定的工具导人到源文件中。例如,将从Adobe Photoshop 的 PSD 文件抽取的文本,翻译后导人到 PSD 文件,生成本地化后的PSD文件。
对于软件、网站、游戏等类型的本地化对象,需要本地化的内容在得到本地化的文件后,还需要通过版本编译(Compile)的软件工程技术生成本地化的产品,如本地化的软件安装程序、网站、游戏。软件本地化编译的工具可以是源语言软件的编译工具,也可以是软件工具定制编写的本地化编译工具。对于视频、音频和人机交互的电子学习材料还需要进行音频导人、字幕层导入、时间轴调整、语音、文字和视频合成等技术,获得本地化的产品。视音频编辑工具包括Adobe Premier Pro、Adobe Captivate等。
编译后的本地化产品(如软件、游戏、网站等)可能含有一些本地化缺陷(Bugs),需要执行测试,以发现和报告缺陷。本地化测试技术包括测试设计技术和测试执行技术,前者包括测试用例设计、测试脚本设计等,后者包括测试环境搭建、测试用例执行、缺陷报告与跟踪等工作。测试工具包括商业测试工具(如HP QTP),也包括开源的测试工具,如缺陷管理工具Bugzilla,还包括各公司定制开发的工具。缺陷修正是对测试发现的缺陷进行验证、定位、修改的技术。如果缺陷是功能失效,则通过使用源软件开发工具(如Visual Studio,Eclipse)修改软件代码实现,对于错译、漏译和用户界面显示等翻译问题,可以使用计算机辅助翻译工具(如Alchemy Catalyst、SDL Passolo)直接修改。
3. 结语
本地化服务是技术驱动的语言服务,本地化过程中广泛应用信息技术和翻译工具。翻译技术是为翻译实践、翻译研究和翻译教学中应用的软件、工具、设施、环境、技巧等的集合。翻译技术一般包括机器翻译技术、翻译记忆技术、翻译中的术语技术、字符识别技术、文件解析技术、译文质量保证技术等。应该根据本地化对象特征、质量要求、组织能力、功能和市场地位制订合适的本地化翻译策略,选择合适的翻译技术与工具。本地化服务中的技术与工具在本地化工程分析、预处理、翻译、后处理环节得到大量应用,提高了本地化工作的翻译效率,提高了翻译质量,保证自动化能力,是本地化服务的竞争力要素。
[发表期刊]
《译苑新谭》,2015年第7辑
[基金项目]
本文是对外经济贸易大学中国企业"走出去"协同创新中心科研项目 (项目编号: 201505YY001B) 的阶段性研究成果。获得对外经济贸易大学中央高校基本科研项目业务费专项资金资助(项目编号:14YB16)。
[作者简介]
崔启亮,博士,对外经济贸易大学国际语言服务与管理研究所副所长,中国翻译协会本地化服务委员会秘书长。研究方向:计算机辅助翻译、本地化、语言服务。
(本文转自“译匠”公众号,已获授权)