标签: database pdf-parsing
我有大量的PDF文件,我希望能够逐句解析。是否有一个MySQL(或其他数据库系统)工具将PDF转换为mysql,然后一次读出一个句子?还有其他工具可以做到这一点吗?我想象将所有pdf加载到DB中然后阅读将是最快的方式,但我真的不知道......
答案 0 :(得分:3)
尝试pdftotext。然后将其插入DB。