我们如何将pdf分为章节和子章节python

时间:2017-01-14 15:31:56

标签: python-2.7 text-mining

如何将大型PDF文件拆分为章节和子章节。例如,我的PDF文件组织如下:

  • I.Chapter1
  • 文字文字
  • A.SubChapter1
  • texttext

  • 1.SubSubChapter1

  • texttext

  • 2.SubSubChapter1

  • texttext
  • II.Chapter2
  • texttext
  • A.SubChapter2
  • texttext

我想获取文本并将数据库写为 chaptername chaptertext subchaptername subchaptertext subsubchaptername subsubchaptertext

感谢您的时间和帮助。

1 个答案:

答案 0 :(得分:0)

我不确定这是否适合您,但您可以尝试阅读此链接:https://automatetheboringstuff.com/chapter13/