遵循此示例https://github.com/OpenRefine/OpenRefine/wiki/Recipes#removeextract-words-contained-in-a-file
我正在尝试使用open refine
删除文件中列出的停用词示例:您希望从文本中删除桌面上文件中包含的所有停用词。在这种情况下,请使用Jython。
with open(r"C:\Users\ettor\Desktop\stopwords.txt",'r') as f :
stopwords = [name.rstrip() for name in f]
return " ".join([x for x in value.split(' ') if x not in stopwords])
不幸的是内部错误