CKAN:收获特殊数据集

时间:2013-05-03 13:53:00

标签: opendata ckan

我想在CKAN实例中导入一组特殊的数据集。使用CKAN-Harvester(http://docs.ckan.org/en/latest/harvesting.html),我可以从另一个CKAN实例中获益。但我不需要所有的数据集。

是否可以仅使用其ID获取特定数据集?

2 个答案:

答案 0 :(得分:1)

不是没有写一些代码。

您可以为收割机添加过滤器。 gather_stage()[1]是CKAN要求最新编辑的包(数据集)并为每个包创建一个作业的地方。然后为每个作业运行fetch_stage()[2]以下载每个作业,然后导入它们。您可以在fetch_stage中进行过滤,也可以更改gather_stage以请求包的子集。

[1] https://github.com/okfn/ckanext-harvest/blob/2.0-dataset-sources/ckanext/harvest/harvesters/ckanharvester.py#L136

[2] https://github.com/okfn/ckanext-harvest/blob/2.0-dataset-sources/ckanext/harvest/harvesters/ckanharvester.py#L199

答案 1 :(得分:0)

截至今天,2016-06-06,这还不是内置的,但是有一个未解决的问题 - Allow filtering of remote datasets to be harvested #155 - 请求完全相同的内容。

在旁注中,CKAN Harvester option to include/exclude organizations #169已在2015-10-27合并,但正如其标题所示,它仅添加了organizations_filter_includeorganizations_filter_exclude