在csv库上使用pandas来处理Python3中的CSV文件

时间:2016-07-10 12:07:51

标签: python csv

请原谅我,如果我的问题太笼统,或者之前已被问过。我的任务是在Python3中操作(例如复制和粘贴几个条目范围,对它们执行计算,然后将它们全部保存到新的csv文件中)几个大数据集。

使用上述图书馆有哪些优缺点?

提前致谢。

2 个答案:

答案 0 :(得分:2)

我没有使用过CSV库,但很多人都在享受熊猫的好处。在Numpy的基础上,Pandas提供了许多你需要的工具。您可以轻松地使用更多高级库进行各种分析(sklearn用于机器学习,nltk用于nlp等)。

出于您的目的,您会发现管理不同的cdv,合并,连接,做任何您想要的事情都很容易。

这是一本快速入门指南的链接。还有很多其他资源。

开始使用pandas python http://pandas.pydata.org/pandas-docs/stable/10min.html

希望有所帮助。

答案 1 :(得分:1)

您应该尽可能多地使用其他人已经为您做过的工作(例如编写pandas库)。这为您节省了大量时间。当您想要处理这些文件时,Pandas可以提供很多东西,所以在我看来这是处理这些文件的最佳方式。由于问题非常笼统,我也只能给出一般答案......当你使用熊猫时,你需要在文档中阅读更多内容。但我不会说这是一个缺点。