标签: algorithm nlp artificial-intelligence
我正在撰写论文,应用程序将使用自然语言问题解答。我已经阅读了几个想法并且关于自然语言问题回答的讨论,但我似乎找不到好的答案。
问题:如何从PDF,纯文本或MS Word文件中获得答案?
如果我想在PDF文件中搜索主题,我会使用 Ctrl + F 来查找主题/想法,但它不会返回所有细节;就像一个目录,它将给出一章的起始页和结束页。这就是我想要的逻辑。它将确定章节的结束位置而不使用页面或数字。有没有算法可以做到这一点?
答案 0 :(得分:0)
我使用iTextPDF阅读PDF文件内容。