返回列表 回复 发帖

详细版trados 基本知识、使用技巧与经验3

Settings -> Project and Filter Settings 对话框

Project and Filter Settings 对话框用于设置 Text/Attribute 字段值以及指定翻译单元的筛选条件。系统默认提供了一个 Text 字段“Text Field”和一个 Attribute 字段,后者包含三个字段值:New、Approved、Read Only。可以通过 File -> Setup -> Fields 选项卡来自定义 Text/Attribute 字段和字段值注1。
有关 Text/Attribute 字段的说明,请参阅以下内容:

    * 关于 Attribute Field 和 Text Field
    * 关于 Multiple Translation(Project Settings 导致 Multipel Translation 的说明)
    * General 选项卡(续)(有关 Textv/Attribute 的说明)
    * Penalties 选项卡(有关 Attribute and text field differences penalty % 的说明)

下文仅讨论具体的设置操作,由于两个选项卡的界面几乎完全一致,因此仅以 Project Settings 选项卡为例来说明。

Projcet Settings 选项卡的设置

Text 字段与 Attribute 字段的一个区别是,在 File -> Setup -> Fields 选项卡中,对于 Text 字段,只能定义 Text 字段名,具体的字段值要在 Project and filter settings 中来填写;而对于 Attribute 时,既要定义字段名本身,也要指定相应的字段值,设置时在 Project and Filter Settings 对话框中来选择所定义的字段值,这从 Projcet Settings 选项卡的界面控件就可以体现出来,具体如下:
①、设置 Text 字段值
  

首先在 Text fields 列表中点选要设置的 Text 字段(当前选中的字段会以蓝色背景显示),然后在右侧的 Text field content 文本框中输入相应的 Text 字段值。输入以后,可以看到,选项卡下部的 Current settings 列表中就会显示所设置的完整字段值,其结构是:<Text 字段>: <字段值>。可以设置多个字段名和字段值。
若要删除所设置的字段值,首先在 Text fields 列表中点选要删除的字段,然后清除右侧的 Text field content 文本框中的字段值文本即可。
②、设置 Attribute 字段值
  

首先在 Attribute fields 列表中点选要设置的 Attirbute 字段(当前选中的字段会以蓝色背景显示),随后,右侧的 Attribute picklist 列表就会显示选中的字段所对应的可选字段值,在该列表中点选所要设置的字段值,选项卡下部的 Current settings 列表中就会显示所设置的完整字段值,其结构是:<Attribute 字段>: <字段值>。可以设置多个 Attriubte 字段,每个 Attribute 字段也可以设置多个字段值。
若要删除所设置的字段值,首先在 Attribute fields 列表中点选要删除的字段值所属的字段,可以看到当前已设置的该 Attribute 的字段值会以蓝色背景显示,点选要清除的字段值即可将其从设置中删除。

Current settings 列表中会显示当前设置的字段值。
③、其他的按钮操作  

    * Reset 按钮 - 清除当前设置的所有字段值;
    * Load. 按钮 - 加载通过点击下面的 Save 按钮保存的字段值设置注2;
    * Save. 按钮 - 将当前选项卡中设置的字段值保存为 .wps 文件;
    * Apply Current Filter Settings - 使 Project Settings 选项卡中的设置与当前 Filter Settings 中的设置一致。

注1:在此简要说明如何定义 Text/Attribute 字段。打开 File -> Setup -> Fields 选项卡:

①、定义 Text 字段

在 Text fields 列表中点选已存在的 Text 字段,使该列表框获得焦点,然后单击 Add 按钮,在按钮右侧的 Field 中输入要定义的 Text 字段名称。关闭选项卡时,单击 OK 按钮。
若要删除所定义的字段,请在 Text fields 列表中点选该字段,然后单击 Delete。

②、定义 Attribute 字段

在 Attribute fields 列表中点选已存在的 Attribute 字段,使该列表框获得焦点,然后单击 Add 按钮,在按钮右侧的 Field 中输入要定义的 Attribute 字段名称。然后点选 Attribute values 列表中的默认值“A value”,在 Field 文本框中将其修改为所需的值,单击 Add 按钮,可以为该字段添加更多的字段值。关闭选项卡时,单击 OK 按钮。

若要删除所定义的字段值,请在 Attribute values 列表中点选相应的值,然后单击 Delete,若要删除所定义的 Attribute 字段,请在 Attribute fields 列表中点选相应的字段,然后单击 Delete。
切记,一旦 TM 中已存在翻译单元,就不能删除所设置的字段和字段值。
注2:要成功加载在 .wps 文件中保存的字段值设置,必须保证 .wps 文件中保存的字段值在当前的 TM 中有定义。否则将显示以下错误信息:

Settings -> Select Target Language 对话框

(STL-1)

如果在 File -> Setup... -> General 选项卡的 Target Languages 列表中选择了多个目标语言,则可以使用  Settings -> Select Target Language 菜单项打开 Select Target Language 对话框;否则,该菜单项处于禁用状态。

如上所述,如果对当前的 TM 设置了多个目标语言,可以使用 Settings -> Select Target Language 对话框来选择当前要使用的目标语言。

Settings -> TM Servers 对话框


该对话框是关于 TM Server 的。笔者没有相关的使用经验,望了解的网友能发贴予以说明。

Settings -> User ID 对话框

(UI-1)

该对话框用于设置“用户 ID”。在向 TM 提交翻译单元或修改其中的翻译单元时,会在翻译单元的 Created by 和 Changed by 信息字段中标记所设置的“用户 ID”。

在显示该对话框时,如果当前打开了某个 TM,则对话框中的 Enter your user ID 文本框处于灰显状态,无法输入或修改 ID。必须通过 File -> Close 将 TM 关闭才能修改 ID。

Settings -> Non-translatable Paragraphs 对话框

(NTP-1)

该对话框用于指定,在翻译 Word 文档时,哪些样式的段落应该跳过而不翻译。在翻译文档过程中,当遇到具有该对话框所指定的样式的文本时,将无法打开翻译单元,从而起到了保护这些内容的作用。

在 Word 中,样式(Style)可看作格式(字体、字号、颜色、粗体、斜体,等等)的集合,常见的样式包括“正文”(Normal)、“标题1”(Heading1)、“标题2”(Heading2)、“标题3”(Heading3),当然,还可以自定义样式。

有两种指定 Non-translatable Paragraphs 样式的方式
①、在 Add 按钮左侧的文本框中输入样式的名称,然后单击 Add 按钮。

②、单击 Open Document... 按钮,选择要翻译的 rtf 文档,然后 Workbench 会检测文档中使用的段落样式,并将检测到的样式的名称添加到该按钮上面的列表中,可以从列表中选中样式名称,使用左侧的 <<Copy 按钮将所选样式添加到左侧的列表中。

左侧的列表中默认包含 Workbench 的特有样式 DO NOT TRANSLATE。

其他按钮:

    * Load... 按钮 - 用于加载使用下面的 Save 按钮保存的 Workbench style list 文件(.wsl)
    * Save... 按钮 - 将当前的 Non-translatable 样式设置保存为 .wsl 文件。
    * Delete  按钮 - 删除左侧列表或右侧列表中的列表项。

现通过以下文档示例进行说明:

(NTP-2)


上面的文档包含了四种样式:

    * Normal 样式 —— 一般的正文样式,这是 Word 的默认样式;
    * Heading3 样式 —— Word 的一种标题样式;
    * DO NOT TRANSLATE 样式 —— Workbench 特有的样式,在 Word 中启动 Trados.dot 模板后,Word 的样式列表中就会包含该样式;
    * Custom1 样式 —— 笔者自定义的样式。

在 Non-translatable Paragraphs 对话框中使用 Open Document... 按钮检测该文档的样式,结果如下:

(NTP-3)

可以使用 <<Copy 按钮设定在翻译时跳过哪些样式。

一般来说,如果要翻译的文档中存在程序代码,且没有处理为灰色的外部 Tag 格式,如果这些程序代码有特殊的样式设置的话,则可以使用该选项卡来提取并设定相应的样式,指定不翻译这些内容。
Tools -> Analyse 对话框

此对话框用于运行 Workbench 的文件字数分析工具 Analyse。整个对话框的内容和操作可以分为三个部分:

    * 分析前的设置和操作
    * 运行 Analyse
    * 处理分析结果。


一、分析前的设置和操作

主要包括三个步骤:

    * 加载文件
    * TM 设置
    * 指定 Log 文件。

1、加载文件


Workbench 可以支持处理多种文档,单击 Add... 按钮打开“Files to Analyse”文件选择对话框,可通过下部的“文件类型”列表来查看可处理的文档类型。

有两种加载文档的方式:
a、单击 Add... 按钮选择文件来加载,可一次性选择多个文件;
b、通过鼠标拖放操作将要分析的文件拖入 Files to analyse 列表。可以一次性拖入多个文件;如果文件位于不同目录,可以运行 Windows 的文件查找,然后将查找结果拖入列表。
此部分的按钮操作:
Add...     按钮 —— 加载要分析的文件;
Remove 按钮 —— 从 Files to analyse 列表移除选中的文件;
Clear      按钮 —— 清空 Files to analyse 列表;

2、TM 设置

由于 Workbench 和 TM 的许多设置会影响 Analyse 的结果,因此在执行分析前需要确认或调整这些设置,这也是对话框中包含 Options 按钮的用意所在。有关字数分析的影响因素,将在下文以专题形式介绍。

单击 Options 会显示一个包含两个选项的菜单:
Translation Memory Options... —— 选择该选项将打开 Workbench 的 Translation Memory Options 对话框并显示 Tools 选项卡(请参阅本贴“Tools 选项卡”说明),前文介绍过,该选项卡用于设置 Workbench 的批处理操作(Analyse、Translate 和 Cleanup)的某些行为。当然还需要确认其他选项卡中的设置;

Project and Filter Settins...     —— 选择该选项将打开 Project and Filter Settins 对话框,其中的 Filter Settings 会影响分析结果,因此如果设置了 Filter Settins,需要在执行 Analyse 前确认这些设置。

3、指定 Log 文件

单击列表右侧的 Log file 按钮将显示一个包含三个选项的菜单:
Browse... 选项 —— 选择保存 Analyse 结果的 Log 文件。Translation Memory Options 对话框的 Tools 选项卡中的 Use same log  file for all TMs 会影响 Log 文件的选用(请参阅本贴“Tools 选项卡”说明);

View...     选项 —— 显示当前指定的 log 文件;
Delete      选项 —— 删除当前指定的 log 文件;

二、运行 Analyse


运行 Analyse 时,Workbench 会按照 File -> Setup -> Segmentation Rule 选项卡中设置的 TU 划分规则,在文档中确定各个翻译单元的起始和结束位置,然后将划分好的 TU 逐个拿到 TM 中去匹配,最后统计匹配结果。

(Analyse-1)

上图是 Analyse 对话框中显示的简要汇总统计结果(Log 文件会包括各个文件的统计结果以及统计汇总结果,与对话框中的汇总结果相比,它还多出了两个统计项:Placeables 和 Chars/Word),现结合该图示对 Analyse 的过程进行说明。

Analyse 的统计结果分为 5 种情况:
Xtranslated   —— 在对经 XTranslated 处理后的文档进行分析时,统计经 XTranslated 处理的翻译单元。使用 Tageditor 打开经 XTranslated 处理后的文档时,可以看到文档中经过 XTranslated 处理的内容默认以灰色显示,并且其翻译单元的标记不是 <TU> 而是 <XU>,Workbench 会将带有这类标记的翻译单元统计到 Xtranslated 这一项;

Repetitions   —— 在分析文档时,当再次遇到已匹配为 Fuzzy match 和 No match 的翻译单元时,会将其记为 Repetition;

100% match —— 文档中与 TM 完全匹配的翻译单元;

fuzzy match  —— 文档中匹配率小于 100% 但大于等于 Minimum match value %(在 Options -> Translation Memory Options -> General 选项卡设置 - <General 选项卡>)的翻译单元在第一次匹配时,将记为 Fuzzy match,而后再出现则记为 Repetition;
No match      —— 文档中匹配率小于 Minimum match value %(在 Options -> Translation Memory Options -> General 选项卡设置)的翻译单元在第一次匹配时,将记为 No match,而后再出现则记为 Repetition;

在分析文件时,Workbench 会将分析过的翻译单元存储在一个临时 TM 中,分析时的逻辑过程大致如下(以下只是逻辑过程,并不保证与实际过程一致,以下叙述中,正式 TM 是指当前使用的实际的 TM,以便与临时 TM 相区别):
1、如果某个翻译单元在正式 TM 中的匹配结果为 100% match,则将该翻译单元记分 100% match,并将其存储在临时 TM 中,然后处理文档中下一个翻译单元;否则

2、如果该翻译单元在正式 TM 中的匹配结果为 Fuzzy match 或 No match,Workbench 会搜索临时 TM,若是其中存储有完全匹配的翻译单元(说明已经在前面分析过了同样的翻译单元),则会将该翻译单元记为 Repetition;否则将该翻译单元记为 Fuzzy match 或 No match,并将其存储在临时 TM 中,然后处理文档中下一个翻译单元。


以上流程的图示如下:

                                                               (Analyse-2)
分析结束后会在对话框中显示统计摘要,并将统计结果保存在指定的 Log.txt 文件和一个位于同一目录且同名的 .csv 文件中,后者可以直接导入 Excel 表,进行工作量统计和工作分配。

三、处理分析结果


在执行分析前,可以看到对话框上部的 Use TM from previous analysis 选项以及下部 Analyse Results 区域的选项和按钮均处于禁用状态。执行分析后,这些选项和按钮都会处于可用状态。使用这些选项和按钮可以对分析后的结果进行相应的处理,现介绍如下:
Use TM from previous analysis 选项

上文提到,Workbench 在分析过程中会将文档中的翻译单元保存在一个临时 TM 库。执行分析后,如果选中了此选项,则在不关闭该对话框的情况下继续执行分析时,就会使用这个临时的 TM 库而不是当前的正式 TM 库。如果使用正式 TM 库进行分析后,选中该选项对分析过的文件再分析一遍,可以看到分析结果完全是 100% match,原因就是临时 TM 库中包含了打开 Analyse 对话框后所分析过的所有翻译单元。如果关闭了该对话框,当前的临时 TM 库将不再有效,下次打开 Analyse 对话框进行分析时,会生成新的临时 TM 库。
有关该选项的一些具体应用,将以专题形式进行讨论。

Analyse Results 区域
View Log File...
—— 查看 Log 报告。
Creat Project TM...
—— 将此次分析中 TM 库的有效 TU(是指 TM 库中对于所分析的文档,匹配结果为 100% 和 Fuzzy match 的 TU)保存为一个新的 TM,这个 TM 中将只包含与所分析的文档相关的 TU。在给兼职翻译发送 TM 时,如果出于保密或文件大小的考虑,可以使用这个按钮生成一个与项目有关的 TM 库,将其发送给翻译人员,但这样翻译人员就无法参考没有匹配上但与项目相关的翻译单元内容。
Export Frequent Segments...
—— 在该按钮后面的文本框中指定一个数字后,单击该按钮可以将文档中重复次数大于等于指定数字的翻译单元提取出来,保存在一个单独的文件中。
如果文件中重复的内容较多,可以将重复的部分抽出单独进行翻译,以减少工作量。在翻译这部分抽取的重复内容时,常常没有上下文环境,因此翻译时最好能够提供原文以便进行参考;如果抽取的某些内容只包含句子的一部分而缺少其他部分,而翻译为中文时又需要调整语序,则应记录这些内容,以便在后续翻译时根据具体的语言环境进行调整。在执行此操作时,应考虑内容重复率、重复量、翻译重复内容的工作量以及后期处理所带来的额外工作,权衡利弊来确定是否有必要如此操作。
Export Unknown Segments...
—— 在该按钮后面的文本框中指定一个数字后,单击该按钮可以将文档中匹配率小于等于指定数字的翻译单元提取出来,保存在一个单独的文件中。

单击 Export Frequent Segments...  和 Export Unknown Segments... 这两个按钮后,可以通过显示的 Create Export File 对话框的“保存类型”下拉列表查看可保存的文件类型,其中的 Systran (*.rtf) 和 Logos (*.sgm) 是适用于“机器翻译工具”(MT)LOGOS™ 和 Systran® 的文档类型。

Workbench 的设计思路是,对于这些重复的或不匹配的翻译内容,可以使用机器翻译和人工两种方式进行处理:
如果使用以上提到的“机器翻译”工具进行处理,则需要保存为相应的文件格式。“机器翻译”工具只能对这些内容进行粗略的翻译,在将“机器翻译”的结果导回到 TM 时,这些导回的 TU 的 Created by 字段会标记为机器翻译,之后,在正式的文档翻译中,如果遇到这类翻译内容,Workbench 会在原有的翻译单元匹配率的基础上按照 Machine translation penalty %(在 Workbench 的 Options -> Translation Memory Options -> Penalties 选项卡设置)扣减匹配率并显示相应的提示信息,以提醒用户这个匹配的 TU 是由机器翻译的,需要进行确认(机器翻译对于中文不适用)。
如果人工来翻译这些抽取出的内容,最好将其保存为 Word (*.rtf) 格式。翻译完成后,将这些内容 Cleanup 到 TM 中。
附件: 您所在的用户组无法下载或查看附件
【专题讨论】字数分析(Analyse)的影响因素

Analyse 的作用就是确认文档中可翻译的内容,然后以翻译单元(TU)的形式在 TM 中进行匹配,最后统计匹配结果。实际上,前面这句话就已经概括了 Analyse 的四个过程:
一、确定可翻译的内容

二、对可翻译内容划分翻译单元(TU)

三、与 TM 中的 TU 进行匹配
四、统计匹配结果


下面具体分析有哪些因素会影响上述过程并最终影响字数分析结果。


一、确定可翻译的内容

1、标记语言文件

HTML 或 XML 这类标记语言文件主要包括两部分内容:“用于设置文本显示格式或处理方式的标记符号”、“实际显示的文本内容”,前者我们称其为 Tag。在对这类文档进行分析时,需要使用到 DTD Setting 文件(ini 文件)。每种标记语言文档都有对应的 DTD Setting 文件,该文件记录了特定类型标记语言文件的文件结构、所包含的元素以及一些文档约定。

Workbench 在进行 Analyse 时需要使用对应的 DTD Setting 文件来区分文档中的 Tag 和可翻译的内容;在将 HTML 或 XML 文件转换为 Tageditor 可处理的 TTX 文件中,也需要使用 DTD Setting 文件来区分 Tag 和可翻译内容。Tag 可分为内部 Tag 和外部 Tag,使用 Tageditor 打开 HTML 文件后,可以看到使用 DTD Setting 文件处理后的结果,其中灰色的 Tag 为外部 Tag,不进入翻译单元,红色的 Tag 为内部 Tage,可以进入翻译单元,而其他的可翻译内容则是构成翻译单元的主体。

由于同一种类型的标记语言文件会对应有多个适用的 DTD Setting 文件,而这些 DTD Setting 文件在处理具体的 Tag 时会有所差别,比如对于某个 Tag,不同的 DTD Setting 文件可能会将其处理为内部 Tag、外部 Tag,甚至可能处理为可翻译内容。

因此来说,DTD Setting 文件至少会在两个方面影响分析结果:

a、对于特定 Tag,将其仍处理为 Tag 还是处理为可翻译的内容会影响到可翻译内容的字数统计。在具体统计翻译内容时,外部 Tag 不进入统计,内部 Tag 会统计为 Placeable 而非字数。由于文档中 Tag 内容数量有限,处理为 Tag 还是可翻译内容对于整个统计字数影响不大,但总会有一些影响;

b、对于特定 Tag,处理为内部 Tag 还是外部 Tag 会影响到翻译单元的划分。我们知道,外部 Tag 是不进入翻译单元的,也就是说,不论 Segmentation rule 如何设置,遇到外部 Tag,翻译单元都会结束,相反,内部 Tag 是可以进入翻译单元的,因此来说,处理为内部 Tag 还是外部 Tag 会影响翻译单元的划分,而同一文档按不同的方式划分翻译单元,匹配结果肯定会有差别。在这一方面,DTD Setting 文件的选用对于字数分析可能会有很大的影响。

有关 DTD Setting 文件的注意事项,请参阅本贴“Tools 选项卡”说明。

2、RTF 文件

一般来说,本地化过程要翻译的 rtf 文档都是处理过的,某些文档会处理为三个部分:灰色部分、黑色部分和红色部分,其中灰色部分可看作外部 Tag,不进入翻译单元,红色的部分可看作内部 Tag,可进入翻译单元,黑色部分是要翻译的内容,进入翻译单元。还有一些文档不包含这些灰色和红色内容。

但不管怎样,在 Workbench 中,还有一类设置会影响到实际可翻译的内容,那就是 Non-translatable 设置。这里所谓的 Non-translatable 是针对使用 Word 编辑的文档而言的,具体来说,Non-translatable 设置用来确定哪些样式的文本内容无需翻译。在 Workbench 中有两处设置 Non-translatable 的位置:

a、File -> Setup... -> Non-translatable Text 选项卡
该选项卡用于指定将哪些样式的文本字符作为无需翻译的内容来对待。在具体指定时可以选择将特定样式的文本字符处理为内部 Tag 或外部 Tag。其对于字数分析的影响和 DTD Setting 文件的情况类似。

b、Settings -> Non-translatable Paragraphs 对话框
该对话框与 Non-translatable Text 选项卡的区别是,前者处理的是段落或句子样式,而后者处理的是字符(这里是词的意思,即英文的 word)样式。如果指定某种样式为 Non-translatable Paragraph 内容,则使用该样式的文本不记入可翻译字数,也不记入 Placeable。有关该对话框的设置,请参阅本贴“Non-translatable Paragraphs 对话框”的说明。


二、对可翻译内容划分翻译单元(TU)

在分析文档时,Workbench 使用所谓的“UI 划分规则”(Segmentation Rule,在 File -> Setup... -> Segmentation Rule 选项卡中设置)来确定翻译单元的结束位置,以此来划分翻译单元,该规则的设置保存在 TM 数据库中。比如,默认的 Segmentation Rule 将“句号”、“冒号”、“问号”、“叹号”、“Tab 符号”以及“段落结束”均视为翻译单元的结束标记。

如果 TM 库中保存的翻译单元的划分规则与当前在上述 Segmentation Rule 选项卡中设置的划分规则不一致,则会影响到分析结果。这里做一个极端的测试。首先在 Segmentation Rule 选项卡中将“划分规则”指定为默认规则,然后翻译某个文档,翻译完成后,修改 Segmentation Rule 选项卡中的设置,只保留 End of Paragraph 规则而将其他规则删除,然后使用 TM 分析已翻译过的原文档,你可能已经猜到了结果。统计结果表明,本来应该完全匹配的文档由于修改了 Segmentation Rule 而几乎完全变成了 No match 的情况(有关示例,请参见本贴“新手入门 3”部分的相关说明)。

因此,不同的 Segmentation Rule 对于分析结果可能会产生重大的影响。

Segmentation Rule 设置保存在 TM 库中,所以,只要没有用错 TM,就不会出现这种情况,但也不能掉以轻心。比如某些文档过于久远而忽略了当初使用的 Segmentation Rule,当 Cleaup 到新的使用不同 Segmentation Rule 的 TM 时,在进行翻译和字数分析时就会出现这类问题。当然翻译人员可以使用 Expand Segment 和 Shrink Segment 来扩展或缩小文档中的翻译单元,使之在形式上与 TM 中翻译单元的 Segmentation Rule 一致,但对于字数分析的影响却不易觉察到,这可能会造成很大的成本损失。


三、与 TM 中的 TU 进行匹配

这里需要指明一点,在获得 TU 的匹配率时,除了计算文本匹配率,Workbench 还会考虑 TU 的 Source 部分的格式差异、是否包含要保留为英文的 Placeable 内容、该 TU 是否由 WinAlign 生成、TU 的自定义信息字段是否与 Filter Settings 的设置匹配、是否存在 Multiple Translation 等因素,Worbkbench 会根据上述情况在翻译单元文本匹配率的基础上扣减匹配值来获得最终的匹配结果,这就是所谓的 Penalty 设置,有关该设置的具体说明,请参阅本贴的“Penalties 选项卡” 说明。另外需要指明,Filter Settings 选项卡中的设置与 Penalties 选项卡中的 Attribute and text field differences penalty % 设置密切相关,二者共同影响匹配结果,具体情况,也请参阅本贴的“Penalties 选项卡”有关 Attribute and text field differences penalty % 部分的说明。

实际上,在统计结果的 95%-99% 统计项中,很多统计的都是属于文本完全匹配但应用了 Penalties 设置的文本内容,特别是匹配率为 98% 和 99% 的翻译单元。


四、统计匹配结果

Analyse 的最后一步是将匹配结果进行分类统计。上文提到,Analyse 会将统计的文本内容分为 Xtranslated、Repetitions、100% match、Fuzzy match 和 No match 五类。而 Fuzzy match 部分又细分为 95%-99%、85%-94%、75%-84%、50%-74% 四类。我们知道,在 Workbench 中使用 Minimum match value %(在 Options -> Translation Memory Options -> General 选项卡设置)值来区分 No match 与 Fuzzy match,因此,该值的设置会影响到翻译单元的统计归属。

举个例子,某个翻译单元的匹配率为 80%,如果将 Minimum match value % 设置为小于或等于 80%,则该翻译单元会统计到 75%-84% 这一列;但如果将 Minimum match value % 设置为超过 80%,则该翻译单元就会统计为 No match。
因此,不同的 Minimum match value % 设置会影响非 100% 匹配的翻译单元的统计归属,进而会影响到最终的统计结果。


下面对以上内容做一个小节:

一、确定可翻译的内容
a、DTD Setting 文件。该设置保存在装有 Workbench 的本地机器中。
b、Non-translatable 设置。该设置保存在 TM 中。

二、对可翻译内容划分翻译单元(TU)
Segmentation rule 选项卡设置。该设置保存在 TM 中。

三、与 TM 中的 TU 进行匹配
Penalties 选项卡与 Filter Settings 选项卡设置。前者保存在装有 Workbench 的本地机器中,后者与 TM 有关。

四、统计匹配结果
Minimum match value % 设置。该设置保存在装有 Workbench 的本地机器中。


最后需要说明:

a、这里之所以强调设置是保存在 TM 中还是保存在装有 Workbench 的本地机器中,其目的在于说明,如果设置保存在 TM 中,则使用任何计算机上的 Workbench 打开 TM,这个设置都不变;而如果是保存在装有 Workbench 的本地机器中,则使用某个计算机上安装的 Workbench 打开任何 TM 时该设置都不变。明确了这一点,在进行 Analyse 时就可以有针对性地检查和调整相应设置。

b、字数分析结果关乎成本收益,在确认这些设置时,首先应与客户的设置保持一致,如果客户未指定设置,则最好使用默认的设置,并同客户确认,以免造成不必要的误差和成本损失。

以上内容如有错误,请网友及时帮助指出,以免以讹传讹,贻误他人。

【专题讨论】关于 Use TM from previous analysis 选项的应用

上文说道,Workbench 在执行 Analyse 时会生成一个临时的 TM 库,并在分析过程中将文档中的所有翻译单元逐个保存在这个临时 TM 中,分析结束后,在不关闭 Analyse 对话框的情况下,可以选中 Use TM from previous analysis 选项,使用这个临时 TM 来继续分析。那么使用临时 TM 库的分析过程与使用正式的 TM 库有什么区别吗?这个选项的作用何在呢?本文对此进行一些尝试性的探讨。


一、使用临时 TM 与正式 TM 在执行 Analyse 时的区别

在上文有关 Analyse 对话框的说明中,给出了使用正式 TM 库执行 Analyse 的逻辑过程和相应图示。通过测试发现,使用临时 TM 库执行 Analyse 与使用正式 TM 库有一些不同。导致这一差别的主要在因素在于,在分析过程中,正式的 TM 库是不变的,而临时的 TM 库却是在不断的加入分析过的翻译单元,而这些新加入的翻译单元又会同后续要分析的翻译单元存在 Fuzzy match 的情况。换句话说,使用临时 TM 库分析某个文档时,与我们翻译这个文档的过程是类似的。在翻译文档的过程中,我们会不断的将翻译单元提交到 TM 中,而这些提交后的翻译单元又可能与我们后续的翻译内容存在一定的匹配,使用临时 TM 库的过程也大致如此。

具体来说,无论是使用正式 TM 库还是临时 TM 库进行分析,如果文档中有两句原文完全相同,并且第一句的分析结果为 Fuzzy match 或 No match,那么分析第二句时,会将其记为 Repetition,这类情况下,两种方法的分析结果是一致的;如果文档中有两句原文类似但不完全相同,并且它们在 TM 中的匹配都为 No match,那么使用正式 TM 分析时,这两句原文会全部记为 No match,但使用临时 TM 进行分析时,第一句原文会记为 No match,但由于分析之后这句原文所对应的翻译单元就加入到临时 TM 库中,因此在分析第二句原文时,结果就可能是 Fuzzy match。


请看下面的示例:

现在要使用一个空的 TM 库对以下文档进行分析,该文档包含三句话,它们之间类似但并不完全相同:

(UTF-1)

首先使用空的 TM 库直接对该文档进行分析,结果如下:

(UTF-2)

然后将 Analyse 对话框关闭并重新打开(因为此时临时 TM 库已包含了这三个翻译单元),先分析一个不包含任何内容的空 RTF 文档,该文档与分析结果没有任何关系,但通过分析这个空文档就可以启用 Use TM from previous analysis 选项。分析完空文档之后(此时,临时 TM 中没有任何翻译单元),选中该选项,使用临时 TM 库分析以上文档,其结果如下:

(UTF-3)

可以看到,在第一个 log 中,三个句子全部分析为 No match,而在第二个 log 中,只有一个句子结果为 No match,其他两个句子的匹配结果是 Fuzzy match,造成这种差异的原因就是临时 TM 库在分析时会不断加入分析过的翻译单元。


二、Use TM from previous analysis 选项的应用

从上面的叙述中你可能已经意识到,这个采用临时 TM 库的方式似乎能够省钱,某种情况下,确实如此,请看以下案例:

1、某本地化部门承接了一个软件本地化项目,软件部分和联机帮助部分已经翻译完毕,马上需要翻译两个 PDF 帮助文档,暂称为“文档 1”和“文档 2”,这两个文档与前面完成的翻译内容关系不大,当两个文档之间有很多相同或类似的内容。该部门的 PM 现在需要向客户确认这两个文档的统计字数(工作量),但客户要求采用一种特殊的字数分析方案,该方案的过程是:首先打开 Analyse 对话框,使用当前已有的 TM 分析第一个文档,不关闭对话框,选中 Use TM from previous analysis 选项,然后分析第二个文档。

PM 将使用常规方式的分析结果(暂称为 log1)与采用客户方案的分析结果(暂称为 log2)进行了比较,发现 log1 和 log2 的 100% 和 Repetition 部分基本没有什么差异,但 Fuzzy match 和 No match 部分差异比较大,具体表现是,log1 的 No match 部分比 log2 多,而 Fuzzy match 部分比 log2 少,两个 log 统计下来,log2 计算出的成本要比 log1 少许多,我们从第一部分的叙述中不难判断导致这种情况的原因。
那么是否这种方案就一定优于常规方案或者说比常规方案节省成本呢?这要视具体情况而定。本文中的这个案例的前提是:文档与 TM 的关系不大,但文档内部或文档之间有很多相同或类似的内容。实际上,使用临时 TM 库的优势在于利用文档内部翻译单元的相关性来降低成本,其缺点是无法充分利用正式 TM 库的资源。因此在判断是否采用这种方案时,需要权衡这两个因素。


不过,需要说明的是,这种非常规的方式实际上很少采用,如果使用的话,应该在本地化部门、客户和兼职翻译之间确认并达成一致,否则三方的分析结果就会存在差异。另外,当处理多个文档并且分配给多个兼职人员来做时,如果这些兼职人员无法实现共享 TM 库,则兼职人员实际处理的字数可能要多于此种情况下 log 的分析结果,因为每个翻译人员都无法使用别人的翻译结果,而此种分析方式的一个暗含假定就是翻译过程中始终使用同一个 TM。注1。

2、 Use TM from previous analysis 选项的另一个应用就是比较文件。如果希望确定两个文件或两批文件的雷同性,可以先使用 TM 分析第一个文件或第一批文件,然后选中 Use TM from previous analysis 选项使用临时 TM 库分析第二个或第二批文件,由第二次分析结果中 Fuzzy match 和 No match 的多少来确定它们的差异程度。使用这种方法可以确定不同版本的同一类文档的差异性;在考虑对文档进行 Xtranlslate 处理时,也可以通过这种方式确定文档之间的相似程度,以判断是否适合使用 Xtranslate 来处理。
注1:实际上,即使使用常规方式来分析多个文件,在将这些文件分配给多个无法共享 TM 的兼职人员来做时,也会遇到类似情况。问题的焦点在于  Repetition 部分。我们知道 Repetition 部分是重复出现的匹配率为 No match 或 Fuzzy match 的翻译单元,这类翻译单元在第一次出现时记为 No match 或 Fuzzy match,后续再出现同样的内容就会处理为 Repetition。但在为多个译员分配文件时,并不能够保证第一个翻译单元与相应的 Repetition 部分分配给同一个译员。

综合看来,在使用常规方式进行分析时,与使用临时 TM 库相比较,分析出来的字数可能会比译员的实际工作量要多,但在将文件分配给多个译员时,又可能会出现以上所述的增加译员实际工作量的情况。二者似乎可以扯平。
以上内容只是客观的进行分析,并不体现本文作者的任何观点倾向,如有不当,恳请网友及时指正。


关于 Project and Filter Settings 选项卡以及 Attribute 和 Text 字段的应用

在阅读本贴前,如有必要,请参阅以下链接:

    * 关于 Attribute Field 和 Text Field
    * 关于 Project Settings 和 Filter Settings
    * 关于 Multiple Translation(Project Settings 导致 Multipel Translation 的说明)
    * Project and Filter Settings 对话框
    * General 选项卡(续)(有关 Textv/Attribute 的说明)
    * Penalties 选项卡(有关 Attribute and text field differences penalty % 的说明)

大体来讲,Project Settins 选项卡的作用就是为提交到 TM 中的 TU 附加信息标记(这里称为自定义字段值),Filter Settings 选项卡的作用就是通过 TM 中的 TU 所附带的这些信息标记来筛选 TU,其筛选机制就是,如果 TM 中的某个 TU 所附带的信息字段值与当前 Projcet Settings 中的设置不符,在确定该 TU 的匹配率时,就按 Attribute and Text field differences penalty 值(Options -> Translation Memory Options -> Penalties 选项卡)扣减匹配率;而对于信息字段值与 Project Settings 完全相符的 TU 则不会进行扣减,因此,在设置 Filter Settings 的情况下,如果有多个文本匹配率相同的 TU,则会对与 Filter Settings 设置不符的 TU 的匹配率进行扣减,在 Workbench 窗口优先显示与 Project Settings 设置相同的 TU,从而达到筛选的目的。(相关内容,请参阅上述文档)。

因此来说,如果希望提交到 TM 中的 TU 附带相应的信息标记以便于区分,就可以使用 Project Settings 来达到目的。比如,你要使用一个 TM 库来保存多个项目的翻译单元内容,使用同一个 TM 保存来自多个客户的项目,或者使用一个 TM 来保存来自同一项目的多个不同组件、版本、文档的翻译单元,在翻译这些内容时,就可以设置相应的 Projcet Settings,使得提交到 TM 的 TU 附带相应的标记。

为翻译单元附加信息标记的初衷就是标识或区分不同来源的翻译单元。翻译单元附加了信息标记后,会带来很多便利:

    * 首先,翻译人员在重用 TM 中的 TU 时,可以根据信息标记来判断 TU 的来源(不同客户、产品、组件、版本、文档),以确定是否采用;
    * 其次,可以使用 Filter Settings 在“翻译文档”、进行“预翻译”和“字数分析”时,优先使用符合筛选条件的翻译单元;
    * 在使用 Export 对话框(File -> Export)从 TM 中导出翻译单元时,以及使用 Maintenance 对话框(File -> Maintenance)维护 TM 时,可以按 Attribute 和 Text 字段值设置筛选条件,只导出符合条件的 TU,或者只对符合条件的 TU 进行维护;
    * ......

当然,在设置 Project Setttings 前,应该清楚它所带来的影响,如果设置了 Projcet Settings,无论你是在翻译过程中提交翻译单元,还是执行 Translate(预翻译)、Cleanup(清除原文及更新 TM),总之,只要是向 TM 中写入(或修改)TU 数据,就会在 TU 上附加 Projcet Settings 中的设置。

另一方面,对于 Filter Settings,无论你是打开翻译单元进行匹配,还是执行 Analyse(字数分析)和 Translate(预翻译),总之,只要是从 TM 中读取 TU 数据进行匹配,就会应用筛选条件。特别是,在进行“预翻译”和“字数分析”时,切记要检查并确认是否需要设置 Filter Settings,因为这个设置会影响到匹配率,将本来应该 100% 匹配但不符合筛选条件的 TU 处理为 fuzzy match,如果这不是你所期望的结果,那么就不要设置 Filter Settings。

简而言之,如果使用 Project Settings 和 Filter Settings,就要充分了解它们所带来的影响,否则,最好不要使用。

以下设计一个案例,具体说明 Projcet Settings 和 Filter Settings 的应用:

某本地化部门翻译了一批来自 IBM 的文档,完成翻译任务后,需要对这批文档进行 Cleanup,以清除文档中的原文并生成完整的 TM。为了使在 Cleanup 过程中提交到 TM 的 TU 附带上相应的项目标记,在执行 Cleanup 前,首先在 File -> Setup -> Fields  选项卡定义了一个 Attribute 字段,字段名为 Client,并为其定义了一个字段值“IBM”,然后,在 Projcet Settings 选项卡中通过选择将 Project Settings 设置为 Client=IBM,最后执行 Cleanup。在 Cleanup 过程中,提交到 TM 的翻译单元就会附带 Client=IBM 标记。

而后,该部门又承接了一个来自 HP 的项目,巧的是,这个项目中好多文档的内容与先前 IBM 的那批文档相同或类似,因此,项目经理决定在翻译过程中使用 IBM 那个项目的 TM 库。项目经理对于 TM 库的使用进行了如下设想:

    * 在翻译 HP 的项目时,提交到 TM 中的 TU 需要附带 Client=HP 标记;
    * 如果在翻译过程中遇到了 100% 匹配的 TU,并且该 TU 是上一个 IBM 项目的 TU, 若是重用该 TU 的翻译内容而不做修改,则提交时希望保留该 TU 原来的 Client=IBM 标记,但也要在其中加入 HP 标记;
    * 如果在翻译过程中遇到了 100% 匹配的 TU,并且该 TU 是上一个 IBM 项目的 TU, 但在翻译当前文档时修改了对应的翻译部分,则希望在提交时保留原有的 TU,并增加一个新的包含修改后内容的 TU,同时在新增的 TU 中附带 Client=HP 标记;
    * 上面的这个情况会导致 TM 中对于同一原文存在两个对应的 TU,因此如果在翻译中再次遇到同一翻译内容,希望在 Workbench 窗口中优先显示带有 Client=HP 标记的 TU;
    * 当某个 TM 中的 TU 的文本匹配率为 100% 时,如果它没有附带 Client=HP 标记,希望扣减其匹配率以提醒翻译人员注意。

上文说道,那个 IBM 的 TM 中已定义了一个 Client 字段,并且为其定义了一个值 IBM。在实施以上设想时,项目经理在这个 TM 库中又定义了一个 Client 值“HP”,然后进行以下设置:

    * 规定翻译人员在使用 TM 前在 Project Settings 选项卡中设置 Client=HP,这样翻译过程中提交到 TM 的翻译单元就会附带 Client=HP 标记。
    * 通过在 General 选项卡(Options -> Tranlsation Memory Options 对话框)中的 Updating attribute and text field 区域左侧设置 merge 选项,使得那些在 IBM 和 HP 的文档里翻译完全一致的翻译单元只保留一个,并且其 field 标记合并在一起:Client= IBM, HP。(请参阅 General 选项卡(续))
    * 在 Project Settings 中将 Client 设置为 HP,当在 HP 的文档中修改了 TM 中已存在的且标记为 Client=IBM 的 TU,提交后,由于译文部分不同,并且原有的 TU 标记(Client=IBM)与当前 Projcet Settings 中的设置(Client=HP)不一致,则会提交一个新的翻译单元,并附带 Client=HP 标记。(请参阅 General 选项卡(续))
    * 在 Filter Settings 中选择设置 Client=HP,这样,使得在 TM 中只有带有 Client = HP 标记的翻译单元才可能具有 100% 的匹配率,而对于那些标记为 Client= IBM 的翻译单元,则会扣减其匹配率(请参阅“Penalties 选项卡” 有关 Attribute and text field differences penalty % 的说明)。因此,对于文本 100%匹配的翻译单元,如果其标记为“Client =HP”或“Client=IBM, HP”,则不会扣减其匹配率,但如果其标记为 Client=IBM,则会进行扣减,从而起到在 Workbench 窗口优先显示带有 Client=HP 标记的 TU 的目的。

翻译过程中使用 TM 库的一个方案设想 ——

有关 Do not create new translation units if only text fields differ 的一个应用

在阅读本贴前,如有必要,请参阅以下链接:

    * 关于 Attribute Field 和 Text Field
    * 关于 Project Settings 和 Filter Settings
    * 关于 Multiple Translation(Project Settings 导致 Multipel Translation 的说明)
    * Project and Filter Settings 对话框
    * General 选项卡(续)(有关 Textv/Attribute 的说明)
    * Penalties 选项卡(有关 Attribute and text field differences penalty % 的说明)

对于最简单的翻译流程,只涉及到翻译和校对两类人员,在实际操作中,他(她)们都要使用 TM 来工作。对于完全由内部人员完成的翻译项目,不同的本地化公司对于 TM 的使用有不同的方案,其各有利弊:

    * 有的公司规定翻译人员和校对人员使用同一个 TM,这种方案的优点是,校对人员的校对结果可以即时地为翻译人员所用,但其缺点也十分明显,由于在校对之前,所要校对的文档的翻译单元都已存在于 TM 中,因此,校对人员需要通过查看 TU 的 Changed by 信息来确定哪些是校对过的内容,而哪些是尚未校对的内容,而且无法使用Translated to fuzzy 按钮()来加快校对速度;
   * 还有一些公司规定,翻译人员和校对人员使用同一 TM 的两个不同拷贝来工作,这样,校对人员在工作时,只要校对过的内容都是 100% match,因此非常容易区分哪些翻译单元已校对过,而哪些尚未校对,其缺点就是校对人员校对过的内容无法通过 TM 即时为翻译人员所用。

在此,我们探讨一个解决方案,使得校对人员即容易识别校对过的内容,又可以使校对过的内容即时为翻译人员所用。为此,我们首先明确以下内容:
1、通过 Attribute 字段和 Text 字段定义 TU 的标记信息,并在 Project Settings 中进行指定,可以在提交 TU 时把 Project Setttings 中指定的 Attribute 和 Text 字段信息附加到 TU(请参阅“Project and Filter Settings 对话框”)

2、通过在 Filter Settings 中指定 Attribute 和 Text 字段信息,可以将其作为筛选条件,从 TM 中筛选带有该字段信息的 TU。筛选的实质过程是,通过设置 Penalties 选项卡(Options ->  Translation Memory Optons...)中的 Attribute and text fields difference penalty 选项,对 TM 中不符合 Filter Settings 设置的 TU 的匹配率扣减 penalty 选项指定的分值,相对提高符合 Filter Settings 设置的 TU 的匹配率,从而可以在 Workbench 窗口优先显示后者。(请参阅“Project and Filter Settings 对话框”)

3、在翻译过程中,对于某句原文,如果 TM 存在完全匹配的 TU,并且当前 Project Settings 中的设置与该 TU 的标记信息不同(且不属于其子集),您没有使用匹配的 TU 所包含的译文而是对其进行了修改然后提交,这种情况下就会将其添加为一个新的 TU,并按 Project Settings 中的设置附加标记信息。这时 TM 中存在两个 Source Segment(原英文)相同但 Target Segment(译文)不同且标记信息也不相同的翻译单元,这种现象称为 Multiple Translation。(请参阅“General 选项卡(续)”)
4、 General 选项卡(Options ->  Translation Memory Optons...)中有一个 Do not create new translation units if only text fields differ 选项,选中该选项后,对于 3 中所述的情况,如果只是 Text 字段不同,则不创建新的翻译单元。而是使用修改后的译文覆盖 TM 中原翻译单元的译文部分(Target Segment)。
首先我们解决第一个问题:如何使校对人员容易区分校对过的内容:
要使校对结果即时为翻译所用,最直接的办法就是使用同一个 TM,但由文章开头的分析可知,这种方案的弊端就是校对人员不好区分校对过的内容。但以上的说明 2 给我们以启示,那就是虽然翻译人员和校对人员共享同一个 TM 库,但可以让他们设置不同的 Project Settings(或者只有校对人员设置 Projcet Settings),这样,由校对人员提交的 TU 就可以附加上与翻译人员不同的 Project Settings,同时,让校对人员在其 Filter Settings 中指定与其 Projcet Settings 一样的设置,这样,凡是由校对人员校对过的 TU,当在文档中再次出现时,由于其 TU 所附带的标记与校对人员的 Filter Settings 一致,因此结果为 100% 匹配而不会扣减匹配率,而凡是由翻译人员提交但没有校对过的 TU,其标记与校对人员的 Filter Settings 不一致,因此会扣减匹配率,使最终的匹配率低于 100%,这样校对人员就可以判断,凡是 100% match 的内容,都是校对过的内容,否则,就是需要校对的内容。

接着,我们解决第二个问题:如何使校对内容即时为翻译人员所用:

看到此处,你也许会感到不解,这个问题不是通过共享 TM 就可以解决吗?确实可以解决,但在具体操作中存在一个不大不小的技术问题。我们先分析一下校对人员如何是如何校对的。在校对翻译内容时,会产生两种校对结果:“认可翻译人员的翻译结果”、“修改了翻译人员的翻译结果”。如果校对人员设置了与翻译人员不同的 Project Settings,对于第一种校对结果,提交后,不产生新的翻译单元;对于第二种校对结果,提交后会将修改后的内容保存为新的翻译单元(如以上说明 3 所述),即出现了所谓的 Multiple Translation。对于第二种结果,翻译人员将会面临困境,因为他(她)需要从中区分哪个是校对过的,然后再使用校对后的翻译内容,而这会在一定程度上影响翻译人员的效率。也许你会想到让翻译人员也设置与校对人员相同的 Filter Settings,但这样做的结果是,对于他自己提交到 TM 中但尚未校对的内容,匹配率会由于扣减而低于 100%,而我们希望这种情况他能够顺利地重用自己提交的翻译单元,因此这个方法不太可取。

实际上,校对人员在修改翻译人员的翻译内容而后提交时,如果能够覆盖原有的内容,而不是生成新的 TU 从而导致 Multiple Transltion,则问题迎刃而解。巧合的是,这就是 Do not create new translation units if only text fields differ 选项的用武之地。使用该选项,如果匹配的 TU 的标记信息与当前 Project Settings 设置只是在 Text 字段上存在差异,修改翻译内容并提交,则不会添加新的 TU 而是覆盖原有的 TU,因此我们规定校对人员设置 Text 字段而非 Attribute 字段即可解决问题。

具体的方案如下:

首先,项目经理使用独占方式打开共享的 TM 库,在 File -> Setup -> Fields 选项卡中定义一个 Text 字段“Status”,然后规定相关人员进行如下设置
校对人员的设置 ——
1、在 Project Settings 和 Filter Settings 中设置 Status 字段,在 Text field content 中输入 approved。
2、确保 Penalties 选项卡(Options ->  Translation Memory Optons...)的 Attribute and text fields difference penalty 选项的值大于零(默认值为 2)。
3、在 General 选项卡(Options ->  Translation Memory Optons...)中选中 Do not create new translation units if only text fields differ。
翻译人员的设置 ——
翻译人员不要设置任何 Filter settings,最好也不要设置 Project Settings,如果设置 Project Settings,也不要像校对人员一样设置 Status: Approved。目的是只有校对人员提交的翻译单元才会标记 Status:Approved。

进行这样的设置以后,如果校对人员和翻译人员对于同伴足够信任,可以使用 Translate to fuzzy 键来加快工作速度,对于翻译人员而言,即可以快速重用自己或其他翻译人员翻译提交的但没有校对的 TU,也可以重用校对过的 TU;对于校对人员,当遇到未校对过的翻译内容或者与校对人员已提交的结果不符的翻译内容时,会停止处理,等待校对进行修改。


该方案的适用前提:
1、翻译人员和校对人员的工作需要同步进行或者存在交叉

2、项目开始时使用全新(空)的 TM 库
3、翻译人员(可以多人)和校对人员(可以多人)共用一个 TM


该方案的不足之处:

1、这种方法有一个弊端。如果校对人员修改了某个句子(Sentence A)的句式并提交,但下文中出现了类似的句子(Sentence B),且 Sentence B 相对 Sentence A 的文本匹配率为 85%。假设当前 Attribute and text fields difference penalty 设置为 2,此时我们计算 Sentence B 在 TM 中的匹配率。Sentence B 在 TM 中有两个与其最相关的翻译单元:由校对修改并标注了 Status: Approved 的 Sentence A 对应的翻译单元(Unit A)、由翻译人员提交的 Sentence B 所对应的翻译单元(Unit B),按照 Attribute and text fields difference penalty 设置和上文 85% 的假设,Unit A 的匹配率为 85%,而 Unit B 的匹配率为 98%(100% - 2%),因此在 Workbench 中会优先显示 Unit B。这样校对需要手动选择来参考 Unit A 的翻译,如果 Sentence A 和 Sentence B 校对的间隔时间较长,或由不同的校对人员来校对,则无法保证句式的统一。一个勉强的补救措施是,将 Attribute and text fields difference penalty 设置的足够大,但最多也只能设置到 20%。

2、与一般的翻译、校对方案一样,此方案的存在的问题是,使用 键保证了翻译和校对人员工作的流畅性,但是,其前提是,翻译人员高度信任校对人员,校对人员之间也互相信任,也就是说使用 键,翻译人员不易发现校对人员的错误,而校对人员之间也不易相互发现所存在的错误。

3、任何方案的不足都可由人来弥补,人的主动性也会提高执行效率。比如校对过程中可以将某些修改过的术语记录下来,及时发送给翻译人员进行修改,并在校对结束前进行统改。翻译人员如果发现校对人员的错误,或者校对人员之间发现了对方的错误,可以通过某种方式互相告知,并进行修正,这些都可以通过填表等交互方式来实现。但是,这类工作都是不可量化的东西,无法具体要求,也无法具体衡量其中的工作量,因此,需要靠激励机制来提高人的主动性,而人的主动性又源自哪里呢?这值得管理人员思考。
返回列表