我正在调查Google精简版以加快我的一些数据工作 - 本周之前从未使用过它,但我喜欢我看到的很多内容。
到目前为止,我最大的问题是,是否可以从Refine调用外部python函数。我知道你可以在内部调用jython,但是它不提供对基于C的python库的访问(例如lxml),而且我在其他地方有我想要集成的脚本,没有大量的复制粘贴或重写麻烦。 / p>
在Refine中有什么选择?我愿意发挥创意 - 我只想要一个稳定,可重复使用的解决方案。
答案 0 :(得分:2)
正如Google Refine Wiki所说:
lxml在Jython中不起作用,因为lxml具有CPython(常规Python)的C绑定,因此不能在仅使用Jython / Java的Refine中工作,并且没有内置的CPython解释器
但您可以尝试Google Refine Python Client Library来创建项目并以编程方式操作数据。
答案 1 :(得分:1)
我要将reclosedev的答案标记为已被接受,但这个故事还有更多内容。
这个问题的另一个答案是你可以设置自己的基于python的API。对于这个项目,我能够设置在本地服务器上运行的django应用程序。将API构建到现有库只需要一个小时左右。
比我想要的更麻烦,但它适合这个项目的账单而不会花太多时间。