使用C#进行文本到文本转换

时间:2012-01-15 19:05:31

标签: c# converter tex

我有一个Tex文件。我想用C#转换为txt文件。 请帮忙。 我确信它包含的信息是纯文本,但使用的格式是Tex。

1 个答案:

答案 0 :(得分:0)

在可以可靠地提取任何类型的文本之前,需要完全解释TeX文件。在C#中编写一个成熟的TeX解释器可能是一个真正的任务,所以我建议使用现有的解释器,它可以输出一种可以更容易解析的格式,例如HTML。

您可能会倾向于编写一个正则表达式来简单地删除所有\command,但这不会给您一个非常准确的结果,因为某些命令会生成自己的文本,并且[不太常见]某些命令吞噬它后面的文字。此外,您将遇到字符更改类别代码的问题,某些字符可能位于活动类别代码中,这意味着字符本身可以是命令。