我在txt中有两个段落。我必须使用python nltk

时间:2017-08-04 03:50:24

标签: python machine-learning nlp artificial-intelligence nltk

第1段

电子商务,通常作为电子商务编写,是使用计算机网络(如互联网或在线社交网络)进行商品或服务贸易的交易或促进。电子商务利用移动商务,电子资金转移,供应链管理,互联网营销,在线交易处理,电子数据交换(EDI),库存管理系统和自动数据收集系统等技术。

第2段

现代电子商务通常使用万维网进行交易生命周期的至少一部分,尽管它也可能使用其他技术,例如电子邮件。电子商务的好处包括访问速度,更广泛的商品和服务选择,可访问性和国际范围。

我必须找到两个段落之间的常用词并打印出来

2 个答案:

答案 0 :(得分:1)

如果您不需要在语言处理方面做一些特别的事情,那么您不需要NLTK:

paragraph1 = paragraph1.lower().split()
paragraph2 = paragraph2.lower().split()

intersection = set(words1) & set(words2)

答案 1 :(得分:0)

You can use set.intersection

app.use('/*',function(req, res) {
    res.sendfile(__dirname + '/public/index.html');
});