Julia Dataframes与Python大熊猫

时间:2014-04-27 10:09:12

标签: python pandas dataframe julia

我目前正在使用python pandas,并想知道是否有办法将数据从pandas输出到julia Dataframes,反之亦然。 (我想你可以用Pycall从Julia调用python,但我不确定它是否适用于数据帧)有没有办法从python调用Julia并让它接收panda的数据帧? (不保存为其他文件格式,如csv)

除了非常大的数据集和运行具有许多循环的东西(如神经网络)之外,使用Julia Dataframes而不是Pandas什么时候有利?

2 个答案:

答案 0 :(得分:5)

所以有一个为此开发的库

PyJulia是一个用于使用Python 2和3

与Julia交互的库

https://github.com/JuliaLang/pyjulia

这是实验性的,但有些工作

其次,Julia还有pandas的前端pandas.jl

https://github.com/malmaud/Pandas.jl

它看起来只是pandas的包装器,但你可以使用julia的并行功能执行多个函数。

至于目前为止哪个更好pandas根据此reading csv in Julia is slow compared to Python

具有更快的I / O

答案 1 :(得分:1)

我是这方面的新手,但最近肯定一直在使用这两种方法。说实话,它们似乎非常具有可比性,但是有更多关于熊猫的文档,Stack Overflow问题,所以我会给它一点点优势。不要让这个事实让你气馁,因为朱莉娅有一些我才刚刚开始理解的惊人功能。对于大型数据集,比如几次演出,两个软件包都很慢但是Pandas似乎有一点点优势(我绝不会认为我的基准测试是确定的)。如果没有对你想要实现的目标有更细致的理解,我很难想象你甚至想要在使用Julia DataFrame时调用Pandas函数的情况,反之亦然。除非你正在做一些非常大脑或使用非常大的数据集的事情,否则我看不出任何一个错误。当你说"输出数据"你什么意思?您是否无法将Pandas数据对象写入文件,然后在Julia DataFrame中打开/操作该文件(如您所述)?再说一遍,除非你有一台非常好的机器读取数据到大熊猫或Julia DataFrame是乏味的,可能会非常慢。