我正在尝试使用pandas来读取.csv文件
df = pd.read_csv('ChildCareCenters06252017.csv')
然后我收到此错误
CParserError: Error tokenizing data. C error: Expected 31 fields in line 3, saw 42
我已经阅读了pandas文档,我已经浏览了类似的其他堆栈帖子,但没有解决方案有效。
我要去这个链接 https://secure.dss.ca.gov/CareFacilitySearch/DownloadData 然后单击托儿中心,然后保存该数据并尝试阅读。
这就是.csv在TextEdit中的样子。 Header and the first couple school entries.
答案 0 :(得分:0)
我下载了.csv
,将其保存为.xlsx
文件,然后使用了read_excel()
代替了该文件:
import pandas as pd
path = "C:\\Users\\nickb\\Desktop\\CCC.xlsx" # update accordingly
df = pd.read_excel(path)
print df.head()
Facility Type Facility Number \
0 DAY CARE CENTER 197416900
1 DAY CARE CENTER 191607790
2 DAY CARE CENTER 197416698
3 DAY CARE CENTER 304370894
4 DAY CARE CENTER 384001195
...