应用错误收集

python - txt文件中的页尾

时间：2016-02-16 20:44:13

标签： python parsing text

我有这个小问题。有没有办法如何识别文本文件中当前页面的结尾？

我有一些PDF文件，我转换为纯文本。现在我想拆分每个页面并使用这些分离的页面。有没有解决办法呢？我只使用转换后的文档 - 有页码但在文本中有其他数字时不准确。

我使用的PDFMiner，有一些转换页面的变量，我可以使用。但是还有很多其他的PDF转换程序，我想编写一个通用的程序。

有人请一些建议吗？谢谢

0 个答案:

没有答案