在哪种情况下,您使用分块而不是完全解析?

时间:2016-08-09 06:20:20

标签: text-mining

分块或浅分析将句子分成句法成分或块的序列,即基于语言属性分组的相邻单词的序列。它通常被称为解析自然语言的有效且强大的方法,也是完全解析的流行替代方法,但在哪种情况下,分块将是更合适的技术 完全解析。

1 个答案:

答案 0 :(得分:1)

这只不过是我个人的偏见,但如果出于某种原因你只需要检测名词和/或动词短语,那么你通常可能会更好地使用分块。例如,对于文档聚类,主题标记或简单地识别关键字,NP或VP分块可能是绰绰有余的。此外,如果您需要使用不存在树库的语言,您可能希望回退到分块。

Chunking通常具有比深度解析快几个数量级的优势,但现代(感知器/神经网络)解析器比五年或十年前的深度解析器快得多。然而,即使到目前为止,深度解析也会扼杀长句。而且,显然,注释树库以训练深度解析器比注释NP / VP短语甚至只是构建基于规则的块更昂贵 - 特别是如果你需要在非英语文本中检测短语。