Openrefine无法按预期工作

时间:2014-10-16 11:05:42

标签: openrefine

我是OpenRefine的新手,所以如果我犯了一个简单的错误,请耐心等待。 我正在解析HTML网站以收集一些日期。

获取单个页面的一切都很顺利,但现在解析HTML失败了。 我正在创建一个新列,基于包含所有页面HTML的列。我正试图获取特定DIV中的数据[20]。

在“基于此列的创建列”窗口中,它为我提供了使用value.parseHtml().select("DIV")[20]时的预览,这正是我需要的...执行它只给我空白单元格。  它甚至告诉我它是“用grel:value.parseHtml()填充0行.select(”DIV“)[20]”

任何线索我在这里做错了什么?

1 个答案:

答案 0 :(得分:1)

您只需要使用.toString()完成输出JSON.org对象作为字符串。

我们的维基上解释了这一点:https://github.com/OpenRefine/OpenRefine/wiki/StrippingHTML#extract-html-attributes-text-links-with-integrated-grel-commands

我还使用该示例更新了select()函数:https://github.com/OpenRefine/OpenRefine/wiki/GREL-Other-Functions#selectelement-e-string-s