从句子中提取关键文本的一般方法(nlp)

时间:2015-03-13 16:53:13

标签: machine-learning nlp

给出如下句子:

Complimentary gym access for two for the length of stay ($12 value per person per day)

我可以采用哪种一般方法来确定健身房或健身房的使用权?

这是名词的POS标记吗?

1 个答案:

答案 0 :(得分:0)

从文本中提取关键字的最广泛使用的技术之一是术语TF-IDF。较高的TF-IDF分数表示单词对文档既重要,也对文档语料库相对不常见。这通常被解释为意味着该单词对文档很重要。

另一种方法是使用词汇链。我建议您使用此paper进行完整说明。

根据您的域名,您可以根据其他方法进行探索。可以找到一个简短的调查here

名词POS标签是不够的。对于您的示例,“逗留时长”也是名词短语,但可能不是关键短语。