如何将DVI转换为tex?

时间:2009-10-25 19:50:06

标签: latex dvi-tex

知道如何获取DVI文件并将其转换为tex吗?

7 个答案:

答案 0 :(得分:10)

这类似于将PDF转换为XML的问题,这被称为“试图将汉堡包变回牛”。 TeX-> DVI和XML-> PDF都在文档结构及其语义中丢失信息。

需要大量的启发式和大型语料库来重新创建(部分)原始文档。它通常不是100%。文本字符串可能是可能的,向量更难。位图几乎是不可能的。

答案 1 :(得分:4)

你问的是不可能的。我认为(与PostScript相同)即使识别DVI文件中的单词也可能需要启发式。 DVI文件描述了在一张纸上放置单个字母的位置,仅此而已。

您可以通过dvi2tty或运行dvips后跟ps2ascii来获得最佳效果。

答案 2 :(得分:4)

还有catdvi,dvitype和dvi2tty,可从ctan获取。

答案 3 :(得分:2)

我很确定这是不可能的。 DVI包含有关呈现页面的信息,而不包含有哪些tex命令。

答案 4 :(得分:2)

对谁再次发现这个问题,或者对于所有回答我的人我找到了最好的答案: 我正在寻找的是多么困难,它试图弄清楚什么可能是一个原始的tex,可以编译成给定的DVI(或者pdf,因为我可以轻松地将DVI转换为PDF格式)。和InftyReader做到了。它工作完美,我尝试了一堆pdfs,然后重新制作成pdfs,这是完美的!

答案 5 :(得分:0)

阅读Description of the DVI file format并编写程序。你的程序结果不是原始文本,但它是合适的。

答案 6 :(得分:0)

呃,好吧,等等。

我认为阻力最小的路径将涉及dvi-> rtf转换器。我发布了一个问题:Q#1859373 dvi2rtf: who can convert DVI files to RTF。在那里我发布了一个未经测试的实现,它提供了一个糟糕的解决方案,抛弃了所有格式。

有了这样的东西,那么你可以使用word2007 / 8和优秀的docx2tex工具将rtf变为tex。

阅读结果会令人不愉快,但我可以看到一些用例。