我可以从谷歌精炼中调用外部* python *函数吗?

时间:2012-02-02 17:54:26

标签: python google-refine

我正在调查Google精简版以加快我的一些数据工作 - 本周之前从未使用过它,但我喜欢我看到的很多内容。

到目前为止,我最大的问题是,是否可以从Refine调用外部python函数。我知道你可以在内部调用jython,但是它不提供对基于C的python库的访问(例如lxml),而且我在其他地方有我想要集成的脚本,没有大量的复制粘贴或重写麻烦。 / p>

在Refine中有什么选择?我愿意发挥创意 - 我只想要一个稳定,可重复使用的解决方案。

2 个答案:

答案 0 :(得分:2)

正如Google Refine Wiki所说:

  

lxml在Jython中不起作用,因为lxml具有CPython(常规Python)的C绑定,因此不能在仅使用Jython / Java的Refine中工作,并且没有内置的CPython解释器

但您可以尝试Google Refine Python Client Library来创建项目并以编程方式操作数据。

答案 1 :(得分:1)

我要将reclosedev的答案标记为已被接受,但这个故事还有更多内容。

这个问题的另一个答案是你可以设置自己的基于python的API。对于这个项目,我能够设置在本地服务器上运行的django应用程序。将API构建到现有库只需要一个小时左右。

比我想要的更麻烦,但它适合这个项目的账单而不会花太多时间。