应用错误收集

如何改善关键字搜索算法？

时间：2019-05-28 13:58:40

标签： python nlp

如何最好地在消息流中标识消息关键字，以便可以搜索“相似”？以新闻聚合器为例，其中消息被组合为故事。最好使用Python。

现在，我使用spaCy和Textacy库搜索关键字。然后，我寻找相交点并按匹配关键字总权重的升序对其进行排序。但是这种方法对邮件的分组非常糟糕。

key_terms = textacy.keyterms.key_terms_from_semantic_network(
  doc,
  normalize=normalize,
  window_width=15,
  n_keyterms=30
)

0 个答案:

没有答案