提取*定义*关键短语周围语境的最简单路径

时间:2015-08-26 09:17:12

标签: python-2.7 visualization nltk gephi

超出Python format, print is aligned but document written on file is warped中所述的问题:我提取了collection.most_common关键字(单词,计数),但现在我必须提取每个关键字的上下文。

逆向工程不是一个设计缺陷,因为一些人类主管坚持要看到关键词。他们会评分要保留哪些关键字或垃圾。

完成后,我必须围绕NodeXL,Networkx或Gephi中的关键字和上下文(NN或NP)创建网络图。

问题:就复杂性而言,哪个更好:

  1. 通过NLTK - > finder.ngram_fd.viewitems() - > Networkx或
  2. 使用collections.most_common - >再次扫描输入文本以提取上下文 - > Networkx?
  3. 任何指导?感谢。

0 个答案:

没有答案