知道如何获取DVI文件并将其转换为tex吗?
答案 0 :(得分:10)
这类似于将PDF转换为XML的问题,这被称为“试图将汉堡包变回牛”。 TeX-> DVI和XML-> PDF都在文档结构及其语义中丢失信息。
需要大量的启发式和大型语料库来重新创建(部分)原始文档。它通常不是100%。文本字符串可能是可能的,向量更难。位图几乎是不可能的。
答案 1 :(得分:4)
你问的是不可能的。我认为(与PostScript相同)即使识别DVI文件中的单词也可能需要启发式。 DVI文件描述了在一张纸上放置单个字母的位置,仅此而已。
您可以通过dvi2tty
或运行dvips
后跟ps2ascii
来获得最佳效果。
答案 2 :(得分:4)
答案 3 :(得分:2)
我很确定这是不可能的。 DVI包含有关呈现页面的信息,而不包含有哪些tex命令。
答案 4 :(得分:2)
对谁再次发现这个问题,或者对于所有回答我的人我找到了最好的答案: 我正在寻找的是多么困难,它试图弄清楚什么可能是一个原始的tex,可以编译成给定的DVI(或者pdf,因为我可以轻松地将DVI转换为PDF格式)。和InftyReader做到了。它工作完美,我尝试了一堆pdfs,然后重新制作成pdfs,这是完美的!
答案 5 :(得分:0)
阅读Description of the DVI file format并编写程序。你的程序结果不是原始文本,但它是合适的。
答案 6 :(得分:0)
呃,好吧,等等。
我认为阻力最小的路径将涉及dvi-> rtf转换器。我发布了一个问题:Q#1859373 dvi2rtf: who can convert DVI files to RTF。在那里我发布了一个未经测试的实现,它提供了一个糟糕的解决方案,抛弃了所有格式。
有了这样的东西,那么你可以使用word2007 / 8和优秀的docx2tex工具将rtf变为tex。
阅读结果会令人不愉快,但我可以看到一些用例。