比较python nlp中的集合

时间:2014-04-21 02:02:04

标签: python set boolean nlp nltk

我正在尝试使用在线教程自学python和自然语言

http://www.nltk.org/book/ch01.html#sec-automatic-natural-language-understanding

在每个部分的最后,他们提供练习题,第一部分我已经完成了除了一个以外的所有练习。这个真让我难过。

在nltk中有一个名为set()的函数,它在列表中提供所有重复单词的所有词汇集。

我们一直在使用集合来存储词汇表。尝试以下Python表达式:set(sent3)<集(文本1)。使用set()的不同参数进行实验。它有什么作用?你能想到这方面的实际应用吗?

我一直在运行带有几个不同参数的代码,但我只是看不到输出中的模式。有人知道什么将一组分类为大于另一组?为什么这可能很重要?

谢谢!

2 个答案:

答案 0 :(得分:1)

对于集合,<用于测试集合A是否是集合B的正确子集。例如,

In [147]: set('ab') < set('abc') 
Out[147]: True

因为set('ab')set('abc')的正确子集。相比之下,

In [149]: set('abc') < set('abc') 
Out[149]: False

因为set('abc')不是正确的自身的子集。

此运算符为documented here

答案 1 :(得分:-1)

这不是对子集的测试。 我做了以下修改。

app.post('/hello', function(req,res){
console.log(JSON.stringify(req.body))
})