在python中,我们可以使用csv module
或pandas.read_csv
函数来处理csv文件。对于Excel文件,我们可以使用xlrd module
或pandas.read_excel
函数。
我经常使用pandas,我觉得read_csv和read_excel函数对我来说很方便。 任何人都可以解释一下这些方法的优点和缺点是什么?
答案 0 :(得分:0)
.xlsx
文件!此更改发生在 version 2.0.0
然而,关于 CSV 文件,我认为在 pandas
和 csv
之间进行速度比较会很有趣。
我的经验是 pandas
模块更严格地读取 CSV 文件。如果一列全是数字而一行是空的,除非您使用 pandas
或类似的东西,否则 NaN
会产生一个 df.fillna('', inplace=True)
值。如果您有混合数据类型,或者您希望列中有 None
或空白值,这可能会很烦人。 csv
库似乎处理得更好一些。
当我在 python2 上使用 csv
时,utf-8
是一个噩梦,但我认为现在使用 python3 会更好。