自动文本摘要

时间:2012-09-16 04:55:41

标签: python django nlp summarization

我决定使用Python / Django开发自动文本摘要工具。

有人可以推荐有关如何入门的书籍或文章吗?

是否有任何开源算法或自动文本摘要中的项目,以便我可以获得这个想法?

另外,你想在Django / Python中为我推荐一个具有挑战性的新FYP吗?

2 个答案:

答案 0 :(得分:2)

首先关闭Paper,我建议:

1-最近的自动文本摘要技术:M.Gambhir和V.Gupta的调查 2-文本摘要技术概述,A.Nenkova

至于Python的工具,我建议看看这些工具:

  1. 征服者:NLTK
  2. 王子:TextBlob
  3. 雇佣兵:Stanford CoreNLP
  4. 篡位者:spaCy
  5. 海军上将:gensim
    首先要了解不同类型的总结以及最适合您的总结。此外,请记住确保您使用适合您所定位语言的预处理工具,因为这对摘要生成器的质量非常重要。

答案 1 :(得分:0)

关于论文,我想在上一个答案中添加下一个:

  1. 翟承祥和肖恩·马松的“文本数据管理和分析”,第16章。
  2. Sholom M. Weiss撰写的“计算机科学中的文本:预测性文本挖掘的基础知识”, Nitin Indurkhya和Tong Zhang(第二版),第9章。