如何将SQL数据库中的表自动作为数据集发布到CKAN中

时间:2017-02-08 12:33:46

标签: ckan

我正在为大学生实施开放式数据门户,这样他们就可以访问在uni的不同建筑物中生成的所有数据集,他们可以处理数据以开发有趣的应用程序。

我安装了CKAN。它的工作正常。我也实施了收割机。

我主要担心的是: 大学的系统存储来自温度,光线,噪音等不同传感器的数据。 项目的目的是将存储在系统上的数据连接到ckan,以便在存储在系统和开放数据平台上的数据之间同步数据。我尝试收割几种来源类型。

请您指导一下可以帮助我连接大学数据存储系统的最佳功能。

我们是否需要设置网络服务器,我们可以通过CKAN收获连接CKAN?

我们是否需要实现像publicopendataeu使用的新扩展(例如,opengov_se等)来连接到不同的资源,或者我们可以使用现有的扩展?

您推荐uni用于存储数据的格式是什么? 目前,数据存储为SQL数据库。

有什么方法可以将这些SQL表连接到Ckan并将这些表作为数据集导入?

1 个答案:

答案 0 :(得分:0)

一些建议:

  • 试试this CKAN extension。这个想法是允许查看远程SQL表。我最后一次尝试它时没有成功但看起来它最近更新并声称CKAN 2.5兼容性。
  • 使用Datastore and Datastore API让底层传感器/数据源直接写入CKAN
  • 让当前系统直接写入CKAN数据存储表(即忽略API)。如果你已经为数据库写入设置了所有内容,那就不太好了,但也许不那么重要。您需要先创建初始CKAN数据集和资源(每个资源1个SQL表)
  • (与上面类似)在数据库表之间创建一些优雅的镜像/复制系统。如果两个DB都是Postgres,也许只有可能/直接。
  • 收获可行,但您必须编写自己的收割机,从数据库中查询/执行导出并将其导入/更新为CKAN资源
  • (与上述类似)从数据库查询/执行导出并使用CKAN / CKAN数据存储API将其导入/更新为CKAN资源的独立脚本