如何解析很多PDF

时间:2010-02-01 20:55:20

标签: database pdf-parsing

我有大量的PDF文件,我希望能够逐句解析。是否有一个MySQL(或其他数据库系统)工具将PDF转换为mysql,然后一次读出一个句子?还有其他工具可以做到这一点吗?我想象将所有pdf加载到DB中然后阅读将是最快的方式,但我真的不知道......

1 个答案:

答案 0 :(得分:3)

尝试pdftotext。然后将其插入DB。