我有一个Tex文件。我想用C#转换为txt文件。 请帮忙。 我确信它包含的信息是纯文本,但使用的格式是Tex。
答案 0 :(得分:0)
在可以可靠地提取任何类型的文本之前,需要完全解释TeX文件。在C#中编写一个成熟的TeX解释器可能是一个真正的任务,所以我建议使用现有的解释器,它可以输出一种可以更容易解析的格式,例如HTML。
您可能会倾向于编写一个正则表达式来简单地删除所有\command
,但这不会给您一个非常准确的结果,因为某些命令会生成自己的文本,并且[不太常见]某些命令吞噬它后面的文字。此外,您将遇到字符更改类别代码的问题,某些字符可能位于活动类别代码中,这意味着字符本身可以是命令。