标签: python-2.7 text-mining
如何将大型PDF文件拆分为章节和子章节。例如,我的PDF文件组织如下:
texttext
1.SubSubChapter1
2.SubSubChapter1
我想获取文本并将数据库写为 chaptername chaptertext subchaptername subchaptertext subsubchaptername subsubchaptertext
感谢您的时间和帮助。
。
答案 0 :(得分:0)
我不确定这是否适合您,但您可以尝试阅读此链接:https://automatetheboringstuff.com/chapter13/