Python Pandas CParserError错误标记数据

时间:2017-06-30 18:15:55

标签: python csv pandas

我正在尝试使用pandas来读取.csv文件

df = pd.read_csv('ChildCareCenters06252017.csv')

然后我收到此错误

CParserError: Error tokenizing data. C error: Expected 31 fields in line 3, saw 42

我已经阅读了pandas文档,我已经浏览了类似的其他堆栈帖子,但没有解决方案有效。

我要去这个链接 https://secure.dss.ca.gov/CareFacilitySearch/DownloadData 然后单击托儿中心,然后保存该数据并尝试阅读。

这就是.csv在TextEdit中的样子。 Header and the first couple school entries.

1 个答案:

答案 0 :(得分:0)

我下载了.csv,将其保存为.xlsx文件,然后使用了read_excel()代替了该文件:

import pandas as pd

path = "C:\\Users\\nickb\\Desktop\\CCC.xlsx"  # update accordingly

df = pd.read_excel(path)
print df.head()

     Facility Type  Facility Number  \
0  DAY CARE CENTER        197416900   
1  DAY CARE CENTER        191607790   
2  DAY CARE CENTER        197416698   
3  DAY CARE CENTER        304370894   
4  DAY CARE CENTER        384001195  
...