Yahoo Pipes:根据文本文件中的单词过滤Feed中的项目

时间:2010-04-22 19:06:11

标签: yahoo yahoo-pipes yql graphical-programming graphical-language

我有一个过滤RSS源的管道,并删除包含我选择的“停用词”的任何项目。目前,我已经为管道编辑器中的每个停用词手动创建了一个过滤器,但更合乎逻辑的方法是从文件中读取这些过滤器。我已经弄清楚如何从文本文件中读取停用词,但是如何对每个停用词应用过滤器操作符一次?

运算符无法在循环结构中应用的文档states explicitly,但希望我在这里遗漏了一些东西。

2 个答案:

答案 0 :(得分:3)

你没有遗漏任何东西 - 过滤器操作员不能进入循环。

你最好的选择可能是用停用词生成正则表达式并使用它进行过滤。例如生成类似(word1|word2|word3|...|wordN)的字符串。

你可能不得不逃避任何奇怪的角色。此外,我不确定正则表达式可以持续多长时间,因此您可能需要将其与多个过滤规则进行分块。

答案 1 :(得分:0)

除了Gavin Brock回答以下Yahoo Pipes之外 根据多个停用词过滤Feed项(标题,描述,链接和作者):

<强>输入