返回列表 回复 发帖

详细版trados 基本知识、使用技巧与经验2

Workbench 的 Options -> Translation Memory Options -> Concordance 选项卡

Concordance 选项卡用于设置与 Concordance 对话框(Tools -> Concordance...)有关的行为,该选项卡也可通过 Concordance 对话框中的“Options...”按钮来访问。Concordance(索引词查询)是 Workbench 重用 TM 数据库的三大机制之一,可以使用文档中某句原文的一部分内容作为索引词来搜索 TM 数据库。

Minimum match value %

【解释说明】
设置搜索的最低匹配率。
【使用提示】
Trados 推荐的最佳匹配率范围为 65% - 75%,默认值为 70%。建议使用默认设置,在实际搜索过程中,可以通过控制搜索词的长度来调整搜索效果。
Maximum number of hits (1-99)

【解释说明】
在 Concordance 对话框窗口中显示的搜索结果数。
【使用提示】
可设定范围为 0 - 99,默认为 30。设置的数值越大,搜索所花费的时间越长。
Reference (read-only) translation memory:

【解释说明】
在执行 Concordance 搜索时,使用第二个 TM 作为(只读)搜索对象,即对两个 TM 都进行搜索。

【使用提示】
这个设置在有一个以上的 TM 可供使用时,非常有用;有时需要使用两个 TM 进行工作,可衡量其各自的重要程度,使用相对较重要的 TM 来作为主 TM,而在此对话框中将另一个 TM 设置为(只读)参考 TM。另外,这个设置会保存在本机的 Trados 安装目录下,因此,在下一次使用新的 TM 进行工作时,如果不需要这个参考 TM,可将本文本框清除,以免误用其中的术语,对翻译造成误导。

Switches 区域

Start concordance search if no segment match is found

【解释说明】
选中此选项后,在打开文档中的某句原文时,如果 Workbench 窗口显示 no match,则会自动打开 Concordance 对话框,并以整句原文作为索引词来进行 Concordance 搜索。
【使用提示】
从理论上来讲,如果将 General 选项卡中的 Minimum match value % 与 Concordance 选项卡中的 Minimum match value % 设置为相同的值,由于选中此选项后引发的 Concordance 搜索是使用整句作为索引词进行搜索,因此,若是 Workbench 窗口中显示为 no match,则 Concordance 的搜索结果也应是 no match。但实际的操作表明,这两种搜索方式似乎采用了不同的搜索方法。即使将 Minimum match value % 设置为相同的值,当 Workbench 窗口出现 no match 时,Concordance 也可能会返回搜索结果。是否选中此选项取决于具体使用的TM 和个人的操作习惯。
Move cursor into Concordance dialog box after search

【解释说明】
Workbench 自动打开或使用命令打开 Concordance 对话框时,将焦点移到该对话框。
【使用提示】
建议选中此复选框。这样便于操作,在查看 Concordance 对话框中显示的搜索结果之后,可以按 Esc 键直接关闭该对话框并将焦点切换回当前工作的文档。
Search first in reference translation memory

【解释说明】
指定是否首先在(只读)参考 TM 中进行搜索。
【使用提示】
可根据两个 TM 的不同重要性和参考价值来确定是否选中此选项。
Apply current filter settings

【解释说明】
指定在搜索时是否应用 Filter Settings 中设置的筛选条件。
【使用提示】
可将其作为一种确定术语使用优先级的方式来使用。这样在搜索时,同等文本匹配率的情况下,会先显示符合 Filter Settings 设置的 TU。
Display translation unit information

【解释说明】
指定 Concordance 窗口显示搜索结果时,是否显示 TU 的信息字段(Created on、Created by、Changed on、Changed by、last Used、usage 以及自定义信息字段)。
【使用提示】
建议选中此选项。可以使用这些信息字段来判断是否使用相关的搜索结果。
Show most recent translation units first

【解释说明】
该选项确定在搜索到多个结果的情况下,是否将 TU 的 Changed on(修改时间)和 Created on(创建时间)作为排序条件之一来显示这些结果。
【使用提示】
如果不选中此选项,则只会按搜索的匹配率对 TU 进行排序;如果选中此复选框,则会首先按匹配率进行排序,然后使用 Changed on(修改时间)和 Created on(创建时间)作为第 2、第 3 排序关键字。

以下两点需要说明:

① 有时,我们会对 Concordance 的搜索结果表示怀疑,比如,我们要搜索“Add New Item”这个 UI 词汇的翻译,假设 TM 中即存在原文部分只有“Add New Item”这三个词的 TU,也存在大量的包含“Add New Item”这三个词的整句的 TU。我们希望搜索结果中会首先显示只包含“Add New Item”这三个词的 TU,但结果常常不尽人意。实际上,我们只是在搜索“Add New Item”这三个词,而“Add New Item”和“Please click Add New Item to add new entry.”在搜索意义上来讲都是 100% 匹配的,因此,并不能保证只包含“Add New tem”的 TU 会在搜索结果中最先显示。

② Workbench 窗口中使用的搜索方法可能与 Concordance 的有所区别,因此在 Workbench 窗口中无法搜索到的句子,在 Concordance 对话框中常常会得到结果。
Workbench 的 Options -> Translation Memory Options -> Tools 选项卡

Tools 选项卡用于设置批量处理工具 Analyse、Translate 和 Cleanup 的行为,具体如下:

General options 区域


Strip unused fonts

【解释说明】
“对于使用 Word 创建的 RTF 文件,文件的 RTF 头包含许多文件中不使用的字体信息。这类信息可能会在 Word 或 Workbench 中引发‘Out of memory(内存不足)’或‘Not enough system resource to display the requested font(资源不足,无法显示所要求的字体)’。”这是 Trados 帮助中的解释。选中此选项后,可通过对原 RTF 文件执行 Cleanup 来清除这些不使用的字体信息。

【使用提示】
移除这些信息可以提高 RTF 文件的处理速度。
Strip unused styles

【解释说明】
“如果 Word 文档包含大量的段落和字符样式,则会降低 Workbench 和 Word 之间的交互处理速度,即使其中的某些样式在文档中并不使用,也会对交互处理性能造成影响。在对文档中的注脚部分进行分析和转换时尤为如此。”这是 Trados 帮助中的解释。选中此选项后,可通过对原 RTF 文件执行 Cleanup 来清除这些不使用的样式。

【使用提示】
对此没有实际的处理经验,将在以后补充相关内容,也请了解这一设置的网友就此问题发表高见。
Strip TW4Win Styles

【解释说明】
选中此选项,在 Workbench 中对文件执行 Cleanup 时,会清除所有 TW4Win 样式(如 tw4winExternal、tw4winInternal 和 tw4winTerm)。

【使用提示】
对此没有实际的处理经验,将在以后补充相关内容,也请了解这一设置的网友就此问题发表高见。
Use same log file for all TMs

【解释说明】
选中此选项后,将对所有 TM 使用同一 log 文件来记录批量处理结果。如果清除此选项,则会对每个 TM 单独使用一个 log 文件,该文件的路径和名称为:“<当前 TM 所在的路径>\<当前 TM 的名称>.log”。在清除此选项的情况下,也可以临时在批量处理工具的对话框中指定其他 log 文件,但下次打开批量处理工具的对话框时,会恢复使用以上指定的默认 log。

【使用提示】
建议选中此复选框,这样便于区分和管理不同 TM 生成的 log 报告。也可以清除此复选框,建立一个单独的文件夹来保存所有的 log 文件,不过,这样在每次更换 TM 进行批量处理时,就需要选择相应的 log 文件。
Save Workbench RTF as TRADOS tag

【解释说明】
在对 RTF 文件执行 Translate 时,生成可在 Tageditor 中处理的 TTX 文件(Trados Tag XML 文件)。

【使用提示】
建议选中此复选框。一般来说,Tageditor 在处理包含 Tag 的文档时具有明显的优势,它不但可以防止对 Tag 进行修改,而且还有相应的保护和检查措施,可避免出现丢失 Tag 的情况以及出现其他 Tag 问题。RTF 文档也同样可以用 Tageditor 来处理。
CSV log file cell separator:

【解释说明】
选择随 log 生成的 CSV 文件中使用的分隔符。

【使用提示】
使用默认值即可。
Backup 区域

Keep backup

【解释说明】
选中此复选框表示在对文档执行 Translate(预翻译)和 Cleanup(清除原文)操作前,对文档进行备份。默认情况下,备份文件使用与原文件相同的名称,但以 .BAK 作为扩展名。直接将 .BAK 改为原来文件的扩展名即可恢复文件。而且,备份文件默认保存在与原文件相同的目录下。但可以选中下面的“Move backup files”复选框,然后在右侧的文本框中指定其他路径。

【使用提示】
建议选中此复选框。对于 TTX 文档,清除原文后,原来的 TTX 文档还会存在;但对于 RTF 文档,则是直接在原文件中进行清除操作,而且一旦清除,就很难通过清除后的文件来恢复原来的双语文件,因此建议进行备份。
Move backup files

【解释说明】
在选中上面的“Keep backup”后,此复选框才可用。使用此复选框可以指定其他路径来保存备份文件。
DTD settings files 区域

【解释说明】
在对 XML、HTML 和 SGML 等标记语言文件进行“字数分析”(Analyse)和“预翻译”(Translate)时,需要使用相应的 DTD settings 文件(注1)。单击右侧的 DTD Settings.. 按钮将打开 DTD Settings Manager,该对话框用于管理和指定 Workbench 和 Tageditor 所使用的 DTD settings 文件(即 ini 文件)。

【使用提示】
有关 DTD settings 文件及使用方面的详细内容,将在后续内容中专门予以介绍。此处仅对与标记文件的批量处理操作有关的方面进行说明。在对标记语言文件进行批量处理时,需要使用合适的 ini 文件(DTD settings 文件),Trados 提供了三个简单的 ini 文件:HTML4.ini、XSL.ini 和 RESX.ini 文件(所在目录:C:\Program files\TRADOS\<所安装的 Trados 版本>\TT),分别用于处理 HTML 文件、XML 文件和 .NET RESX 文件。在具体的项目中,客户也可能会提供自己的 ini 文件。在对标记语言文件进行批量处理时,Workbench 会检查 DTD Settings Manager 中列出的 ini 文件,从中选择合适的 ini 文件(注2)。列表中可能会包含多种类型的 ini 文件,也可能包含多个同一类型的 ini 文件,具体的选择规则如下:

①从 DTD Settings Manager 列表中选择适用的 ini 文件,如果同时有多个 ini 文件适用,则使用第一个 ini 文件;

②如果没有适用的 ini 文件,则使用已设置的默认 ini 文件;
③如果即没有适用的 ini 文件,也没有默认的 ini 文件,或者列表中没有任何 ini 文件,则跳过处理文件,同时在 Log 中写入错误消息。

因此,在对标记语言文件进行批量处理时,应检查 Workbench 中的 DTD Settings Manager 列表,确保存在要使用的 ini 文件,如果有多个适用的 ini 文件,应确保要使用的 ini 文件在列表中位于其他适用的 ini 文件之前。对话框中没有提供调整 ini 文件顺序的按钮,如需要,可通过 Add 和 Remove 按钮间接调整或将不需要的其他 ini 暂时移除(不会将实际的 ini 文件删除)。

需要强调的是,同一类型的 ini 文件可能会有多个,而每个 ini 文件对于该类型的标记语言文件的处理方式可能会有所差异,比如某些内容在一个 ini 文件中处理为 Tag,在另一个 ini 文件中可能会处理为可翻译的内容,因此来说,ini 文件的正确与否会影响到字数分析的结果。在具体的项目中应确保使用客户指定的 ini 文件,如果没有指定,应使用 Trados 默认提供的 ini 文件。有关字数分析的影响因素,将专门予以介绍。

Multiple translations 区域

Always add new translation unit when target segments differ

【解释说明】
选中该复选框的情况下,如果在执行“预翻译”以及“清除原文”时选中了“Update TM”选项,则在使用文档中的翻译内容更新 TM 时,若是 TM 中已经存在某个 TU,但文档中的译文与该 TU 的译文(target 部分)不同,则会添加一个新的 TU。清除此复选框的情况下,则会覆盖已存在的 TU。

【使用提示】
该复选框需要在创建 TM 时选中 Allow multiple translation for identical source segments 选项后才能使用。如果创建 TM 时未选中“允许 multiple translation”,则该复选框将不可用(呈灰显)。选中该复选框后,在进行批量处理时,如果所处理的文档存在 Multiple Translation 的情况,则会导致 TM 中也出现 Multiple Translation。有些客户使用此选项来检查所翻译的文档中是否存在 Multiple Translation。有关 Multiple Translation,请参见本贴第 39 楼的相关内容。

注1:众所周知,标记语言文件主要由所谓的 Tag 元素和要显示的内容组成,Tag 元素用于指定要显示的内容的显示方式。在对标记语言文件进行“字数分析”和“预翻译”时,需要将 tag 与要翻译的实际显示文本相区分,DTD settings 文件的作用就在于此。每种类型的标记语言文件(比如 HTML 文件、XML 文件)都对应有各自的 DTD settings 文件,DTD settings 文件中包含特定类型标记语言文件所使用的元素(tag)和实体(特殊字符)及此类文件的处理方式等信息。具体来说,在对标记语言文件进行字数分析或在预翻译过程中将其转换为 TTX 文件时,使用 DTD settings 文件来确定将哪些内容处理为外部 Tag、哪些处理为内部 Tag,哪些处理为可翻译内容。

注2:Workbench 使用所谓的“根元素”(root element)来确定适用于特定标记语言文件的 ini 文件。使用文本编辑器打开标记语言文件,可以看到位于文档顶部的“根元素”(比如 XML 文件中的 xml),有时也会在 DOCTYPE 中声明根元素(比如 HTML 文件中的“<!DOCTYPE html...”)。而每个特定类型的 ini 文件中也会存在包含根元素的字符串“DOCTYPE=<根元素>”(比如 DOCTYPE=HTML),来表明该 ini 文件的适用类型。Workbench 就是根据根元素来确定适用于特定标记语言文件的 ini 文件的。

【新手入门 1】
1、使用 Workbench 进行翻译时,充分利用 Workbench 窗口中的各种信息对翻译十分有帮助,下图对打开翻译单元时 Workbench 窗口中显示的各种信息进行了说明:

UI 信息字段:一般包括系统字段(Created on、Created by、Changed on、Changed by、Last used、Usage),如果该 UI 有自定义的信息字段,也会显示(如图中的 Client: HP、Project ID: 001)

UI 的原文和译文:单击左侧的国旗图标可以选择对当前显示的 UI 执行“编辑”和“删除”操作

UI 选择按钮:有两种情况,UI 选择按钮(< 和 >)会处于可用状态: ①、当前 TM 中有多个 100% 匹配的 UI;②、当前没有 100% 匹配的 UI 但存在多个属于 fuzzy match 的 UI。

匹配率扣减信息:只有在 Options -> Translation Memory Options...-> Penalties 选项卡中进行了设置且当前 UI 符合 Penalty 条件时才会扣减匹配率并显示该信息。

Filter 设置信息:只有在当前的 Settings -> Project and Filter Settings -> Filter Settings 选项卡中进行了设置后才显示该信息。
Project 设置信息:只有在当前的 Settings -> Project and Filter Settings -> Project Settings 选项卡中进行了设置后才显示该信息。

2、充分利用窗口 UI 中的颜色标记来加快翻译速度

Workbench 在比较文档中的原文(以下称为 Source 1)和 TM 中 UI 的原文部分(以下称为 Source 2)后,会在窗口中进行一些颜色标记,来指示二者之间的差异,其差异主要有以下三种情况:
①、Source 1 中的某个(些)词在 Source 2 中替换为其他词,用黄色分别在 Source 1 和 Source 2 中标注

                    


②、Source 1 中的某个(些)词在 Source 2 中改变了位置,用蓝色分别在 Source 1 和 Source 2 中标注



③、Source 1 与 Source 2 比较,多了某个(些)词或少了某个(些)词,会使用灰色在 Source 1 或 Source 2 中标注多出来的部分



了解了这些差异后就可以有的放矢,充分利用原有的翻译内容,修改必要的部分,加快翻译速度。
附件: 您所在的用户组无法下载或查看附件
【新手入门 2】

在使用 Workbench 时,应明确我们有三个可以重用原有翻译内容的途径:
①、利用 Workbench 的主窗口,获得整句原文的搜索匹配结果
②、利用 Workbench 的 Concordance 工具,以整句中的部分内容作为关键词进行搜索
③、利用  Trados 的组件工具 Multiterm 实现词汇(术语)的检索重用

第一个途径主要查找整句内容;第二个途径可用于查找术语、某些词汇的翻译以及某些句式的翻译模式等;第三个途径主要用于查找特定术语的翻译。

有两点需要说明:

①、在翻译文档时,Workbench 使用所谓的“UI 划分规则”(Segmentation Rule,在 File -> Setup... -> Segmentation Rule 中设置)来确定翻译单元的结束位置,以此来划分翻译单元,该规则的设置保存在 TM 数据库中。比如,默认的 Segmentation Rule 将“句号”、“冒号”、“问号”、“叹号”、“Tab 符号”以及“段落结束”均视为翻译单元的结束标记。但有时候会出现这种情况:你的 TM 库设置的是默认的 Segmentation Rule,但导入了或者 Cleanup 了只使用“段落结束”作为规则的翻译单元,这时候,本来完全匹配的内容就会显示为 no match,如以下示例

我们在文档中要翻译这两句话:

The company is a multi-language vendor offering services in Simplified Chinese, Traditional Chinese, Korean, and Japanese languages. And it's list of big clients includes HP, IBM, MICROSOFT, SONY etc.



当前 TM 的 Segmentation Rule 为默认设置,但 TM 有一个 UI 是按“段落结束”规则形成的翻译单元,且与上文完全匹配,如下图:




(XSRM 3-1)




在文档中就这段话打开翻译单元时,Workbench 窗口如下所示:




这是因为,当前 TM 使用了默认的  Segmentation Rule,因此认为第一个句号为翻译单元的结束位置。

这时,我们使用 Workbench 菜单中的“扩展句段”命令(在 Tageditor 中为 Expand Segment,快捷键为 Ctrl+Alt+Page Down),扩展翻译单元的内容,将下面那句话包含在当前的翻译单元中,则 Workbench 窗口显示为:






因此,在 no match 的情况下使用 Expand Segment 命令有时会有意外的惊喜,该命令的反向操作是 Shrink Segment(快捷键为 Ctrl+Alt+Page Up)。使用 Expand Segment 命令的前提是,当前翻译单元后面要合并的内容没有形成翻译单元,且合并操作可持续进行至遇到第一个外部 Tag(在 RTF 中为灰色文本)为止。一般在翻译软件的内容时可能会使用“段落结束”规则。建议翻译中慎用此命令,以免造成实际的 Segmentation Rule 与 TM 中的设置不符,影响字数分析时的匹配率,给客户带来额外成本。

②、客户在对要翻译的内容进行文档预处理时,对于同一产品但不同版本的文档,可能会采取不同的处理方式,因此,文档处理后的文本结构,特别是对于不翻译内容的处理会有所差异,由此也带来了一些问题,比如下例

If the value of the code property is "Camera.muted" , the user has refused to allow the SWF file access to the user's camera.


老版本对于句中斜体部分 code 和 "Camera.muted" 处理方式为将其处理为红色的内部 tag,这可以从 TM 中存储的 TU 窥之一二:


   (XSRM 3-4)



对于这句话,新版本的文档中处理为以下结果:




   (XSRM 3-5)






可以看到,除了将斜体部分 code 和 "Camera.muted" 处理为红色的内部 tag 之外,其前面还添加了显示为灰色的 ID 信息,无疑,在打开翻译单元时,会将灰色部分视为翻译单元结束标记,因此,打开的第一个翻译单元为“If the value of the ”,匹配结果将为 no match。

由此可知,由于文档不同版本的处理方式的差异,原本没有任何更新而完全匹配的内容在此变成了 no match。对于翻译人员,这种情况下就可以使用 Workbench 的 Concordance 工具来找到原来完全匹配的翻译内容,而对于客户,这种处理方式会造成一定的成本损失。
【新手入门 3】

本节结合 Workbench 的 View 菜单,介绍使用 Workbench 工作时的一些界面显示设置和布局。

1、首先介绍 Workbench 的 View 菜单,该菜单比较简单,因此提供以下附图进行简要的说明。

标准的 Workbench 窗口

Show Translation
  
选中此菜单项后,在 Workbench 窗口的 TU 窗格中不显示 TU 的译文部分


Big Windows
  
选中此菜单项后,将不显示 TU 的字段信息和 TU 选择按钮
Toggle Menu on/off
打开(F10)或关闭(Alt+F10)菜单,下图是设置 Big Windows 和关闭菜单后的 Workbench 窗口


Zoom
设置右侧的“文档原文”窗格和 TU 窗格中文本的显示大小。
Tag Text
  
设定右侧窗格中 Tag 的显示形式。共有三种设置:

①、None(只显示一个竖条标记来表示当前位置为 Tag)

②、Partial(显示一个小长方框,中间标有文字 TAG)

③、Full(显示一个小长方框,中间显示完整的 Tag 内容)



User Interface Language...
  
设置 Workbench 界面 UI 的显示语言,该语言选项中包括 Chinese,但在笔者所使用的 Trados 6.5 中,没有任何效果。
Pin on Top
  
选中此菜单项后,当在窗口间切换焦点时,Workbench 始终显示在最前方。

2、工作窗口布局:

在使用 Workbench 进行翻译时,需要能够同时显示 Workbench 窗口和文档编辑器(一般为 Word 或 Tageditor)。在具体使用中,通常会将 Workbench 放在上面,然后调整编辑器窗口的大小,将其放在下面,如下所示:




当然,根据个人习惯,也可以将编辑器放在上面,而将 Workbench 放在下面。

对于繁体中文以及其他需要竖排的语言,还可以按以下方式进行布局(具体设置方式,请参见注1):




在使用 Word 作为编辑器时,由于 Word 被调整为屏幕的约 2/3 大小,因此实际编辑空间就显得狭小。可以通过以下方式增加编辑空间:
①、通过“视图 - > 标尺”菜单项隐藏标尺;

②、取消选中“工具 -> 选项 -> 视图”选项卡中“显示”区域的“状态栏”复选框,隐藏状态栏;根据个人喜好,可通过“工具 -> 选项 -> 视图”选项卡中“格式标记”区域的“隐藏文字”显示或隐藏“原文”和“Worlbench 标记”。

③、右键单击工具条,设定只显示所需的工具条,以减少占用的空间。对于一般的文档,只保留“常规”和“格式”工具条即可。对于具体的工具条,可通过以下方式删除不使用的命令按钮:选择“工具-> 自定义...”菜单项,将显示“自定义”对话框,在相应的工具条中右键单击要删除的命令按钮,选择删除即可(只有打开“自定义”对话框,才能删除工具条中的命令按钮)。如要添加命令按钮,切换到“自定义”对话框的“命令”选项卡,在左侧的“类别”列表中选择选项,右侧的“命令”列表中会显示相应的命令,然后可以从“命令”列表中将所需的命令拖放到某个工具条。

“常规”工具条中的“格式刷”和“显示/隐藏编辑标记”按钮一般应予以保留,如下图所示:


“格式刷”的作用是可以将文档中某些文本的格式应用到其他文本。一般来说,进行翻译时,Word 文档中的内容主要分三部分:原文、Workbench 标记、译文,前两者均为带下划线的隐藏文字。如果不慎破坏了它们的格式,可以使用格式刷进行恢复。使用“格式刷”时,首先选中要应用其格式的文本,然后点击“格式刷”,鼠标指针将带有一个小刷子标记,这时即可选择相应文本,应用格式。如果双击“格式刷”,可以多次应用格式,如果单击“格式刷”,则只能应用一次格式。

使用“显示/隐藏编辑标记”按钮可以控制是否显示编辑标记,包括空格标记。本地化的翻译工作对于文本的格式有严格的要求,某些类型的翻译特别要求在中文与英文之间应保留空格,因此使用“显示/隐藏编辑标记”显示空格标记后,可以更好的保证格式准确无误。其在 Tageditor 中有一个对应的工具栏按钮,如下所示:


注 1:当然,你也猜到了,这个布局结构是编造出来的。做这个图的目的是想说明:a、对于某些较成熟的软件,如 Word,你能想到的需求,它基本都可以满足,所要做的就是大胆的设想和尝试;b、对于 Trados 这样的专业性软件,有时需要结合其他软件和技术来实现解决方案,有些思路和想法是可以实现的,而有些还在企盼中。
Options -> Terminology Recognition Options 对话框

在 Workbench 中,重用原有翻译内容的手段之一就是术语识别和重用,在使用 Workbench 时结合 Trados 的 MultiTerm 组件就可以实现这一功能,而本对话框就是用于设置此类功能的。由于此部分内容涉及到了 MultiTerm 组件,所以整个内容拟分为三部分:
一、Terminology Recognition Options 对话框设置

二、在翻译过程中使用 MultiTerm 术语库的简要说明
三、将 Excel 格式的术语表导入 MultiTerm 术语库

一、Terminology Recognition Options 对话框设置

Terminology Recognition Options 对话框包含有两个选项卡:Termbase 和 Settings,Termbase 选项卡用于指定所要使用的 MultiTerm 术语库以及索引语言,而 Options 具体设置查询术语时的一些操作行为。由于设置都比较简单明了,以下仅做简要介绍:

Termbase 选项卡
Terminology provider 区域
  

指定所要使用的 MultiTerm 术语库的类型(或版本)。

默认情况下,在 Workbench 6.5 中,MultiTerm version: 后面的下拉列表中会自动包括 MultiTerm 5 (TRADOS 5) 选项。而如果安装了 MultiTerm 6.x 或 MultiTerm 7,下拉列表中也会包含 MultiTerm 6.x 或 MultiTerm 7 选项。
Termbase location 区域
  

指定 MultiTerm 术语库的具体位置。如果在 Terminology provider 区域选中了 MultiTerm 5 (TRADOS 5) 选项,则单击 Browse... 将打开文件选择对话框,可以在其中指定要使用的 .mtw(MultiTerm 5 的术语库文件格式)文件;如果选中的是 MultiTerm 6.x 或 MultiTerm 7,则单击 Browse... 后会显示一个 MultiTerm 6.x 或 MultiTerm 7 风格的术语库选择对话框,可在其中指定术语库。如果选中的是 MultiTerm 7,单击 Browse... 后会显示如下所示的 Open Termbases 对话框:


(TRO-1)

单击加号按钮将打开 Select TermBase 对话框,选中 Local TermBase,下面的列表就会显示当前本地存在的所有 MultiTerm 7 术语库,可从中进行选择。如果使用的是远程术语库,可选择下面的 Remoter termbases 选项,然后进行相应的设置。有关 Open Termbases 对话框中其他按钮的使用,请参考对话框中按钮的提示信息或查询帮助。
Language selection 区域
  

选定术语库后,会在该区域显示术语库中的索引语言。对于“英-中”对照的双语术语库,索引语言就是指“英语”和“中文”。Source language: 和 Target language: 下拉列表会显示索引语言,可以对这两个对话框进行调整,但切记,在 Source language 下拉列表中选择的语言应与当前 TM 的源语言一致。

Setings 选项卡
Tuning 区域
  

用于设置查询的具体行为。

①、Minimum match value% - 指定查询术语时的最低匹配率,默认为 70%

②、search depth (10-999) - 指定最多可以显示多少条符合 Minimum match value% 的术语,默认为 20。

③、Default Settings - 单击该按钮可以将 Minimum match value% 和 search depth (10-999) 重置为默认值。
Run terminology recognition in the background 选项
  

在使用术语库的情况下,打开翻译单元时,Workbench 会同时执行两个操作:①、搜索 TM 数据库;②、搜索术语库。只有这两个操作都完成之后,才会正式打开相应的翻译单元。一般来说,搜索术语库的操作耗费的时间比搜索 TM 数据库要长,当句子中包含较多的术语或通过网络使用术语库时更是如此。如果选中此选项,则会将这两个操作分开独立进行,Workbench 在执行完搜索 TM 数据库的操作后即会打开翻译单元,即使搜索术语库的操作尚未完成也是如此,这样就可以加快打开翻译单元的速度。默认情况下,该选项处于选中状态。

二、在翻译过程中使用 MultiTerm 术语库的简要说明

在文档中针对某个句子打开翻译单元时,如果该句中包含当前术语库中的术语词汇,Workbench 窗口上部的“文档 Source”窗格显示的 Source 中会使用红色的括线标注这些术语,其中第一个术语使用较粗的括线标注,右侧的“术语”窗格中会显示该术语条目,如下图所示:


将鼠标指针放到任一括线的上方,指针会变成手型,单击该括线会在“术语”窗口中显示括线下方的术语条目,单击后的括线将变粗,表示“术语”窗格当前正在显示其下方的术语条目。“术语”窗格中只会显示索引语言内容,比如对于“英-中”双语术语库,只会显示英文术语和对应的中文翻译。某些术语库的结构比较复杂,除了包含必要的索引语言内容之外,每个条目还会包含其他的一些定义性或说明性的信息。如果要查看完整的术语条目信息,可单击“术语”窗格中术语条目左侧的“字典”图标,此操作将打开 TRADOS MultiTerm 窗口,其中会显示每个条目的完整信息。

在具体操作中,当打开包含术语的翻译单元后,可以使用 Workbench 的术语按钮(如下图所示)或使用相应的快捷键将术语的翻译内容复制到文档翻译单元的译文部分中光标所在的位置,使用“取下一个术语”(Get Next Term)或“取上一个术语”(Get Previous Term)可以在不同的术语间切换,这样可以免去使用鼠标在 Workbench 的“文档 Source”窗格中点选相应的术语。


三、将 Excel 格式的术语表导入 MultiTerm 术语库(适用于 MultiTerm 6.2 之后的版本)

从 MultiTerm 6 开始,MultiTerm 只接受 XML 格式的文件作为数据源,因此,使用外部数据源生成 MultiTerm 术语库的过程可以简单分为三个过程:
①、将外部数据源转换为相应的 XML 文件,这可通过 MultiTerm 自带的 MultiTerm Convert 工具来完成;

②、在 MultiTerm 中创建 MultiTerm 术语库(也可使用已有的术语库);

③、将步骤 1 生成的 XML 文件导入步骤 2 中生成的术语库。

下面就以从 Excel 术语表生成 MultiTerm 术语库为例来具体说明这些过程。有关如何从 MultiTerm 5 术语库升级到 MultiTerm 6 或 MultiTerm 7 术语库的步骤,可以查看 MultiTerm 附带的 Tutorail 教程,而从 .csv 文件和 txt 文件生成 MultiTerm 术语库的过程与 Excel 文件差别不大,且不具有典型性,此处就不做说明了。

过程 1 - 生成 XML 文件

下图是要导入的 Excel 术语表,该表分为三列,分别为“英文术语”、“中文翻译”和“定义”内容,在第一行设置了 3 个列标题 - English、Chinese 和 Definition:



(以下步骤中的蓝色部分为说明文字,可略去不看。)

a、打开 MultiTerm Convert 工具,单击 Next。

b、选择 New conversion session。如果希望下次重用此次的设置,可以选中 Save conversion session 并指定相应文件路径来保存设置,下次操作时,选择 Load existing conversion session 并进行相应指定即可。单击 Next。

c、在 Available conversion options 中选中 Microsoft Excel format,单击 Next。

d、单击 Input file 文本框右侧的 Browse... 按钮指定要转换的 Excel 文件。指定 Excel 文件后会默认将生成的 XML 文件、xdt 文件和 log 文件保存在该 Excel 文件所在的同一目录,当然可以单击下面的 Browse... 按钮修改相应的保存路径。需要说明的是,在将外部数据源(包括 MultiTerm 5 术语库、.csv、.txt 和 .xls)转换为 XML 文件时,会生成一个 XML 文件和一个 xdt 文件,XML 文件保存外部数据源的内容,而 xdt 文件保存所生成的 XML 文件的结构,在创建 MultiTerm 术语库时会使用到 xdt 文件。选择数据源后单击 Next。

e、这一步设置“索引字段”和“描述字段”。MultiTerm 的每个术语条目至少要包含两个“索引字段”,分别对应术语的两种语言表述,比如这里的“English”和“Chinese”,此外,条目中还可以包含其他说明性信息,比如这里的“Definition”。左侧的 Available column header 列表中列出了前面所选择的 Excel 表的列表题(English、Chinese 和 Definition),需要在此指定它们的字段类型。从 Available column header 列表选中 English,将其指定为 Index field,然后在下面的语言列表中选择 English (United States);选中 Chinese,将其指定为 Index field,然后在下面的语言列表中选择 Chinese (PRC);选中 Definition,将其指定为 Descriptive field,然后在下面的列表中将其文本类型设置为 Text(如下图所示)。单击下一步。


f、左侧的 Entry stucture 列表简要显示了要生成的 XML 的基本结构,但未包含 Definition 字段。单击 Entry stucture 列表中的 Entry level,然后从右侧列表中选中 Definition,点击 <<Add,将其插入到结构表中与 English 和 Chinese 同级的结构位置(如下图所示)。单击 Next。

(TRO-6)

g、确认设置,然后单击 Next。

h、进行转换,结束后会显示转换结果。单击 Next,然后单击 Finish 完成转换过程。可查看生成的 log 报告来确认转换结果

至此,完成了从 Excel 表到 XML 文件的转换。需要说明的是,MultiTerm 6 的某些版本不支持中文路径,因此 Excel 表要存放在英文路径下,但 MultiTerm 7 则无此限制。另外,应确保术语表位于 Excel 的第一个工作表。

过程 2 - 创建 MultiTerm 术语库

从 Excel 表成功生成 MultiTerm 术语库的关键是保证,转换后的 XML 文件的结构与所创建的 MultiTerm 术语库的结构一致。为了确保一致,在创建术语库时,可以使用在上一过程中生成的结构定义文件 .xdt 来设置术语库的结构,使得所创建的 MultiTerm 术语库在结构上与 XML 文件一致,这是最方便的办法。如果要完全自定义术语库的结构,则需要注意一些细节。以下先介绍如何使用 .xdt 文件设置术语库的结构,然后再具体说明在自定义术语库结构时如何保证结构的一致性。

a、打开 MultiTerm,从 Termbase 菜单选择 Create Termbase...,在随后的对话框中指定术语库的保存路径,然后单击“确定”。

b、在随后打开的 Termbase Wizard 欢迎界面中,会列出创建 MultiTerm 术语库的主要步骤。单击 Next。

c、指定如何创建术语库的结构。若要自定义术语库结构,请选择 Create a new termbase definition from scratch;若要利用 MultiTerm 提供的模板来创建,请选择 Use a predefined termbase template;若要使用 xdt 文件来创建,请选择 Load an existing termbase definition file,然后选择生成 XML 文件时附带生成的 xdt 文件。这里使用 xdt 文件来创建,选中 Load an existing termbase definition file 选项,指定 xdt 文件,然后单击 Next。

d、指定术语库的名称、描述信息和版权信息。该名称将显示在 Workbench 的术语库选择列表中。单击 Next。

e、可以看到,在所显示的 Available index fields 列表中,已列出了 XML 文件中的索引字段。如果是自定义设置术语库,则需要指定这些索引字段。接受 xdt 文件所指定的索引字段而不做修改,单击 Next。

f、Available descriptive fields 列表中已列出了 XML 文件中的描述字段,如果要设置其他描述字段,可以在左侧文本框中指定,然后单击 Add>>。单击 Next。

g、可以看到,Entry structure 列表中显示的术语库结构与过程 1 的步骤第 f 处列出的结构一致,只是,这里用 Index level 表示那里的 English 和 Chinese(如下图所示)。单击 Next。

(TRO-7)

h、单击 Finish,完成术语库的创建。
附件: 您所在的用户组无法下载或查看附件
过程 3 - 将 XML 文件导入术语库

a、在 MultiTerm 窗口左下方的窗格中选中刚刚创建的术语库。从 Termbase 菜单选择 Import Entries...,打开 Import 选项卡。可以看到术语库的很多操作都集中于此。

b、在 Import 选项卡中,单击右侧的 Process... 按钮。在打开的下一个窗口中选择要导入的 XML 文件并指定 log 文件的保存位置,然后单击 Next。

c、指定 Exclusion 文件。该文件用于保存 XML 文件中由于不符合术语库结构而无法导入的那些条目。下面有一个 Ignore sublanguage 选项,将在后面进行说明。单击 Next。

d、单击 Next。开始导入术语条目。完成后会显示导入结果。如果出现错误信息,可查看在步骤 b 中指定的 log 文件

e、单击 Next,单击 Finish。关闭 Import 选项卡。

至此导入完毕。这时可看到,MultiTerm 的右侧窗格中已列出了导入的第一个条目的内容。然后,即可关闭 MultiTerm,转到 Workbench 来设置使用已创建的 MultiTerm 术语库。

回顾以上所有过程,有关 Excel 表中的标题、术语库的条目结构以及 Workbench 的 Terminology Recognition Options 选项卡的索引语言可用以下图示关系来说明:

                                                                    (TRO-8)

如果是自定义术语库的结构,则需要确保 Excel 表的索引标题与术语库的定义一致,如下图所示:

                                                                               (TRO-9)

图 TRO-9 中,左上角显示的是创建术语库结构时设置索引字段的界面,右侧是要转换的 Excel 表,左下方是转换后的 XML 文件的一部分内容。由图 TRO-9 中的 Available index fields 列表可以看到,在自定义术语库结构时,我们选中了 Languages 下拉列表框下面的 Show sublanguages 选项,此时,Languages 列表框中就出现了子语言选项(所谓子语言,即指某种语言下面的语言分支,比如中文 Chinese 有 Chinese <HongKong S.A.R.>、Chinese <PRC>、Chinese <Singapore> 和 Chinese <Taiwan> 等子语言),在此选择了 English (United States) 和 Chinese (PRC) 作为索引字段,如图 所示(当然也可以不使用子语言,此处只是为了说明起见)。

从上图可以看到,每个索引字段包含两部分,比如英语索引字段由 EN-US 和 English (United States) 两部分组出,这里暂分别将其称为“语言标记”和“语言类型”。Excel 表的语言标题部分即对应这里的“语言类型”。因此,为了保证 XML 结构与术语库的一致性,要求 Excel 表中的语言标题内容必须与自定义术语库时选择的“语言类型”完全一致(文本内容、空格、全角半角格式和大小写格式都必须一致),否则,导入 XML 文件时会由于结构不一致而失败,这也是通过自定义方式来创建术语库的关键所在。

而如果是使用 xdt 文件来定义术语库的结构,因为这相当于将 XML 文件的结构完全复制到术语库结构,则不存在这类问题,你可以在 Excel 表的标题“胡乱”输入任何内容,甚至在转换时可以随意选择任何语言,都不会影响你使用术语库,但需要注意的是,你的 Workbench 的 Terminology Recognition Options 选项卡的索引语言所显示的内容将与 Excel 表的语言标题一致。

总之,如果选择自定义术语库或者使用已存在的术语库,则必须保证 Excel 表的语言标题、在转换 Excel 表的步骤 e 中指定的索引语言与术语库的设置完全一致。另外需要说明的是,MultiTerm Convert 工具所提供的索引语言列表中,某些语言(比如中文和英文)仅提供了子语言选项。而在自定义术语库时,即可以使用语言选项,也可以选择使用子语言选项。如果在自定义术语库时,也是指定子语言选项,则当然没有任何问题。但如果指定的是语言大类而不是具体的子语言,或者现有的术语库已指定了语言大类而非子语言,则也不必担心,在导入过程的步骤 c 可以选中 Ignore sublanguage 选项,这样只要属于同一语言类别就都可以导入。

Options -> Translated Text Colours 对话框

为了能够帮助区分文档中翻译单元 (TU) 的原文和译文部分,可以指定 Workbench 使用不同的颜色对文档中 TU 的原文和译文部分进行标记,Translated Text Colours 对话框就是用于指定这类颜色设置的。下文分为三部分:
①TU 原文和译文部分的颜色设置

②使用颜色设置的一些负面问题
③有关翻译单元颜色设置的建议

一、TU 原文和译文部分的颜色设置

1、为何要对翻译单元的原文和译文部分设置颜色

为翻译单元的原文和译文部分设置不同的颜色,其主要目的就是在文档中能够对这两者加以区分。另为,在设置译文部分时,可对 full match 和 fuzzy match 的情况分别指定不同的颜色,这样也有利于区分这两种情况。在具体的翻译工作中可以通过这种方式来加快翻译速度,如果客户要求只处理非 full match 的情况,则可以根据颜色来进行区分。不过,这种颜色设置也会带来一些问题。实际上,可以使用 Tageditor 中的 Set Close Next no 100% Open Get 命令或 Word 的 Workbench 菜单的“保存/关闭并打开获取下一非完全匹配句段”来快速定位到 no match 的部分。

2、Translated Text Colours 对话框设置

                                                                           (TTC-1)

该选项卡简单明了,现说明如下:
Source colour
设置翻译单元原文部分的颜色

Target (100% match)
设置 100% 匹配的翻译单元译文部分的颜色

Target (fuzzy match)
设置 fuzzy match 情况下的翻译单元译文部分的颜色

Suggest 按钮
将以上三项颜色设置为 Workbench 的推荐颜色,分别为 Blue(“蓝色”)、Dark Green(暗绿)、Dark Yellow(暗黄)。

Reset 按钮
将以上三项颜色设置为 Unchanged,即不使用任何颜色标记原文和译文,而保留文档原有的颜色设置。
设置完成后,下面的列表框中会显示颜色设置示例。

3、适用情况

该颜色设置适用于在文档中打开翻译单元的操作以及 Workbench 的“预翻译”(Tools —> Translate)批处理操作。另外,这个颜色设置主要是针对 Word 的。而对于 Tageditor,“预翻译”过程可能会有效,但对于打开翻译单元的操作则没有效果。

4、颜色设置对于 Cleanup 后的文档的影响

一般来说,如果文档的原文部分原来就带有颜色,在对原文和译文部分应用颜色标记的情况下, Cleanup 后会恢复原有的颜色设置,但在某些情况下也会出现问题(将在第二部分讨论)。

二、使用颜色设置的一些负面问题

1、不宜在 Translated Text Colours 对话框中设置原文档中出现的文本颜色,否则可能会造成问题:例如,以下是文档中的原文,分别对一个词和整句使用了蓝色、红色和暗黄色:

                                                                         (TTC-2)

如果在 Translated Text Colours 对话框使用 Suggest 按钮设置了颜色,则 Source Colour 和 Target Colour (fuzzy match) 会分别设置为“蓝色”和“暗黄色”,与文档中的颜色重复。进行“预翻译”后的结果如下所示(假设这两个句子在 TM 均为 full match):

                                                                            (TTC-3)

可以看到,上图中的原文中红色保留了下来,第二句原文部分整个变成了蓝色。

Cleanup 后的结果如下所示:

                                                                        (TTC-4)

可以看到,Cleanup 后,第二句话原有的暗黄色变成了黑色。造成这种情况的原因是,如果在 Translated Text Colours 对话框设置中指定了颜色,在形成翻译单元时,Workbench 会将文档中与所设置的三种颜色相同的任何文本的相应颜色部分作为黑色来处理,即将这部分设置为 Translated Text Colours 对话框中指定的颜色;而在 Cleanup 时,Workbench 会将所有这三种颜色的文本修改为黑色,因此在 Cleaup 后就可能出现丢失原有颜色的情况。如果在 Translated Text Colours 对话框中将颜色设置为 Unchanged,则会保留原文档的颜色而不做修改。

2、如果使用颜色标注了文档中的翻译单元,则在对译文部分进行修改时,可能会造成同一译文句子中颜色不一致的情况,这也可能会导致出现 Multiple Translation。在 Tageditor 中进行此类修改时就会出现这种情况。
在 Tageditor 中对如下图所示的翻译单元进行修改:

(TTC-5)

假设开始觉得句首的“在从”两字不妥而将其删除,而后又恢复原来的翻译,手动输入“在从”两个字,由于 Tageditor 会默认将光标前面的颜色格式应用到当前光标位置输入的内容,因此所输入的“在从”两个字使用它前面原文部分的颜色 — 蓝色,从而造成了一句译文中存在多种颜色,如下图所示:

(TTC-6)

将这个翻译单元提交到 TM,其译文部分存储的实际内容是:

(TTC-7)

可以看到,其中的译文部分加入了文本颜色标记 cf2(蓝色)和 cf11(绿色),与下图所示的情况比较,其文本部分完全相同,但由于前者加入了颜色标记,因此它们属于不同的译文。

(TTC-8)


当然,你可以想方设法使整句格式一致。实际上,如果句子的内部格式不一致(不只限于颜色),提交到 TM 中时就会加入格式标记。详情请参见本贴“Penalties 选项卡”内容部分的注释 1。

3、 Translated Text Colours 对话框中的设置是保存在本地的,也就是,在你的机器上使用 Workbench 打开任何 TM 时,这个设置都不变(除非你进行修改)。因此,如果是向客户提交文件,或者和其他人合作完成项目,当你的 Translated Text Colours 对话框设置与客户或其他人的不一样时,就会出现问题。比如,某个文档中的文本完全为黑色,但在你的 Translated Text Colours 对话框中采用了推荐的设置方式,但你的客户则设置为 unchanged,这种情况下,如果你只提交双语文件而由客户自己来 Cleanup,就会出现问题。在你提交的文档中,full match 部分和 fuzzy match 部分分别使用了“暗绿色”和“暗黄色”;客户在 Cleanup 你的文档时,由于他的 Translated Text Colours 对话框设置为 Unchaged,会将“暗绿色”和“暗黄色”译文部分视为原文原有的颜色,因此会保留这些颜色。这样,原本没有颜色的原文变成了有颜色的译文,如果对文档的颜色有严格的要求,就会造成问题。

三、有关翻译单元颜色设置的建议
1、鉴于以上可能存在的问题,如没有特殊考虑,建议尽可能使用 Unchanged 设置

2、在与客户交接项目时,建议确认 Translated Text Colours 对话框的设置。

3、如果必须设置颜色,应避免设置文档中出现的颜色。
4、对于最终要生成纯文本的文档,设置颜色虽然对于文档的使用没有任何影响,但在具体处理时应避免出现上文提到的句子内部出现多种格式的情况。
返回列表