他们似乎非常相似,我很好奇哪个包对财务数据分析更有利。
答案 0 :(得分:278)
实际上,pandas提供了基于NumPy构建的高级数据操作工具。 NumPy本身就是一个相当低级的工具,与使用MATLAB非常相似。另一方面,pandas提供丰富的时间序列功能,数据对齐,NA友好统计,groupby,合并和连接方法以及许多其他便利。近年来,它在金融应用中变得非常流行。在我即将出版的书中,我将有一章专门讨论使用大熊猫进行财务数据分析。
答案 1 :(得分:54)
大熊猫需要Numpy(几乎所有Python的数字工具都需要)。 Pandas不严格要求Scipy,但列为“可选依赖项”。我不会说大熊猫是Numpy和/或Scipy的替代品。相反,它是一个额外的工具,提供了一种更简化的方式来处理Python中的数字和表格数据。您可以使用pandas数据结构,但可以自由地使用Numpy和Scipy函数来操作它们。
答案 2 :(得分:3)
Pandas提供了一种操作表的好方法,因为您可以轻松地进行分箱(binning a dataframe in pandas in Python)并计算统计数据。在pandas中很棒的其他东西是Panel类,你可以使用不同的属性连接一系列图层,并使用groupby函数组合它。