gettext套件中的工具用于统一具有模糊匹配的源字符串?

时间:2014-01-31 15:35:05

标签: localization internationalization gettext qa

有没有办法利用gettext套件中的工具做一些像模糊匹配一个PO文件中的源字符串来查找几乎相同的字符串?这似乎是一个有用的质量检查,以改善来源。例如:

#: my_file
msgid "Sorry, something went wrong"
msgstr ""

#: some_other_file
msgid "Sorry, something went wrong."
msgstr ""

#: yet_another_file
msgid "Sorry, something is wrong"
msgstr ""

这些字符串实际上是相同的,并且可能会更改源代码以在每个实例中使用相同的消息。这将减少l10n工作并使UI更加连贯。在我看来,msgmerge中的模糊匹配算法应该已经非常适合识别这些实例。然而,我找不到一个明显的方法来做到这一点。

1 个答案:

答案 0 :(得分:2)

在没有人工监督的情况下,你不想做任何折叠。 大多数翻译工具都有这个功能,但是人类应该验证这种折叠。 由于上下文,你甚至无法完成相同的字符串。

为什么:

  • 按钮("命令")经常被翻译成不同于标签和标题("描述)")
    例:"打印"被翻译成法语为" Imprimer" (按钮)或"印象" (标题)
  • 性别,数量,案例,将改变翻译。
    示例:翻译"新"西班牙语按钮可以给你" Nuovo" (男性,单数)," Nuevos" (男性,复数)," Nueva" (女性,单数)" Nuevas" (女性,复数)
  • 如果具有不同的含义,则可以对同一个词进行不同的翻译。
    例:"扫描"如果是扫描磁盘(病毒)或扫描一张纸,将有不同的翻译。

所以,你并不想"神奇地合并字符串"如果价格较低,翻译质量可以节省几美分。