我目前正在使用python pandas
,并想知道是否有办法将数据从pandas输出到julia Dataframes
,反之亦然。 (我想你可以用Pycall
从Julia调用python,但我不确定它是否适用于数据帧)有没有办法从python调用Julia并让它接收panda
的数据帧? (不保存为其他文件格式,如csv)
除了非常大的数据集和运行具有许多循环的东西(如神经网络)之外,使用Julia Dataframes而不是Pandas什么时候有利?
答案 0 :(得分:5)
所以有一个为此开发的库
PyJulia
是一个用于使用Python 2和3
https://github.com/JuliaLang/pyjulia
这是实验性的,但有些工作
其次,Julia还有pandas
的前端pandas.jl
https://github.com/malmaud/Pandas.jl
它看起来只是pandas的包装器,但你可以使用julia的并行功能执行多个函数。
至于目前为止哪个更好pandas
根据此reading csv in Julia is slow compared to Python
答案 1 :(得分:1)
我是这方面的新手,但最近肯定一直在使用这两种方法。说实话,它们似乎非常具有可比性,但是有更多关于熊猫的文档,Stack Overflow问题,所以我会给它一点点优势。不要让这个事实让你气馁,因为朱莉娅有一些我才刚刚开始理解的惊人功能。对于大型数据集,比如几次演出,两个软件包都很慢但是Pandas似乎有一点点优势(我绝不会认为我的基准测试是确定的)。如果没有对你想要实现的目标有更细致的理解,我很难想象你甚至想要在使用Julia DataFrame时调用Pandas函数的情况,反之亦然。除非你正在做一些非常大脑或使用非常大的数据集的事情,否则我看不出任何一个错误。当你说"输出数据"你什么意思?您是否无法将Pandas数据对象写入文件,然后在Julia DataFrame中打开/操作该文件(如您所述)?再说一遍,除非你有一台非常好的机器读取数据到大熊猫或Julia DataFrame是乏味的,可能会非常慢。