是否有基于perl或python的开源工具来生成文档思维导图的摘要

时间:2011-01-19 09:58:53

标签: python perl nlp

我真的在寻找一个工具包或现成的工具,它将解析给定的文档,然后生成一个更好的文档思维导图的简短摘要。我知道Python有ntlk和perl有很多模块可以帮助自然语言解析等。 编写一个这样的工具甚至可行,使用ntlk之类的工具包,但由于时间不够。如果你知道一些这样的工具或有一些指向这样一个工具的指针,如果你可以在这里发布,请提前感谢,我将不胜感激。

2 个答案:

答案 0 :(得分:1)

某人(此处为SO)已经written it for youdiscussion)。另一个选项是TexLexAn(文本分析器分类器摘要器)。

答案 1 :(得分:0)

谷歌的人可能已经在做这样的事了。 ; - )

如果我找对你,你需要一个可以为你读书的工具,然后简要地总结一下你的所有内容,这样你就可以节省时间阅读它。也许你对内容不感兴趣,而是想把这些材料归类,例如图书管理员。

对于在非常专业的领域中具有许多非常相似的文档的非常结构化的文本,这可能在技术上是可能的,例如论文的数学证明或实验结果或医学报告。当然,有可能拥有一种工具,可以区分小说和电话簿,粗略地分类文学。显然,提供页面或单词计数,识别书面语言等非常容易,因为这些参数可以清楚地定义。

很可能,计算机将无法掌握实际故事,更具会话性或随意性。因此,要确定谁是好人,谁是坏人,或者手头的部分是否是一部以探员或刑事惊悚片为特色的爱情小说,侦探爱上某人,机器就没有机会决定什么是什么可行的内存量,CPU功率和知识库。

如果您可以更具体地了解您想要使用此工具的实际目的,那么它可能会有所帮助。