我有一个单词列表,想要在文本中搜索这些单词。我的列表如下:
split_list = [y for x in old_list for y in x.split()]
set_list = list(set(split_list))
['Hello', 'Welcome', 'World'] #this is how the list looks like
现在我想获取该set_list并使用该列表中的所有单词搜索文本。我尝试了什么:
words_text = set(set_list).intersection(the_text)
print words_text
我只打印了set_list。我错过了什么?如果set_list有单词“Hello”,我需要新列表中文本中的所有“Hello”。喜欢:['你好','你好','欢迎','你好',...]
答案 0 :(得分:1)
集合交集仅返回共同的单词的集合。每个单词只列出一次(因为这就是集合中的内容)。
要多次列出单词,请尝试:
[word for word in the_text.split() if word in set_list]