当我执行file = pd.read_csv("x.csv")
时,它确实将csv读入了数据帧,并且进行了head()
,看起来正确,并显示了正确的列。
由于我的csv有1M +行,因此我希望在执行len(file)
时看到1M +,但是我看到的是19M +。可能是什么问题呢?使用我朋友的计算机并对测试的csv文件执行相同的操作,可以在执行len(file)之后得到正确的行数。
文件包含奇怪的特殊字符,例如汉字,可能显示为??。在csv中。
因此,我很确定这不是因为使用的功能-更有可能是python 2和3之间的区别,使用的分隔符(默认为)还是脏数据(例如缺少行)或其他原因吗?
例如包含csv的
col1 col2 col3 col4
a 112 111 q??p