使用okapi将xlf转换为html

时间:2014-07-07 23:50:19

标签: file-conversion xliff

我已经实现了一个本地服务,允许将多种格式(如html,docx,xl​​sx,tmx ...)转换为XLIFF。在使用xlf生成的文件执行特定进程后,我希望将其恢复为原始格式。我为此目的使用了okapi库,一切正常。

我想知道okapi是否实现了将xlf转换为原始文件格式的机制,特别是xlf到html(这种格式对我来说是必须的)。

有没有合适的方法?

提前致谢

2 个答案:

答案 0 :(得分:1)

是的,这通常是可能的。 Okapi将其称为合并,除了翻译的XLIFF之外,它还要求源HTML(或其他格式)文件可用。

这样做的常用方法是使用一对彩虹管道。第一个("提取")管道如下所示:

  • 过滤活动的原始文件
  • [其他步骤,例如分段,是 这里可选]
  • 彩虹翻译套件创作(选择"通用 XLIFF"作为类型)

这将生成一个"翻译工具包"包含源文件,提取的XLIFF以及名为manifest.rkm的文件中的一些元数据。然后,您可以修改XLIFF以执行转换等。然后,使用另一个管道执行合并:

  • 过滤活动的原始文件
  • 彩虹翻译工具包合并

令人困惑的是,此合并管道的源文件应该是翻译工具包的manifest.rkm文件,而不是XLIFF或源文件。 Okapi将解析清单并找出其他所有内容,然后将XLIFF中的翻译合并回HTML的新输出副本。

如果您对XLIFF做了足够可怕的事情,Okapi无法弄清楚如何将已翻译的片段映射回原始文档,这个过程可能会失败。

使用与Okapi捆绑在一起的tikal命令行工具,在没有工具包的情况下执行相同操作的快速而肮脏的方法。首先,使用此方法将test.html提取到test.html.xlf

tikal.sh -fc okf_html -x test.html

然后,将已翻译的test.html.xlf合并到输出test.out.html

tikal.sh -fc okf_html -m test.html.xlf

答案 1 :(得分:0)

我不明白你的问题:你能不能将文件转换回来?我不这么认为,这就是答案。

http://www.opentag.com/okapi/wiki/index.php?title=Rainbow的Okapi文档说: 有许多格式的过滤器,例如:OpenOffice,XML,HTML,属性,DTD,MS Office,表格等。

要将XLIFF文件转换回原始格式,您必须将过滤事件添加到原始文档步骤到命令管道。有两种可用于HTML的过滤器配置,另一种用于HTML 5。