Question

我正在尝试使用pandas来读取.csv文件

df = pd.read_csv('ChildCareCenters06252017.csv')

然后我收到此错误

CParserError: Error tokenizing data. C error: Expected 31 fields in line 3, saw 42

我已经阅读了pandas文档，我已经浏览了类似的其他堆栈帖子，但没有解决方案有效。

我要去这个链接 https://secure.dss.ca.gov/CareFacilitySearch/DownloadData 然后单击托儿中心，然后保存该数据并尝试阅读。

这就是.csv在TextEdit中的样子。 Header and the first couple school entries.

Answer 1

我下载了.csv，将其保存为.xlsx文件，然后使用了read_excel()代替了该文件：

import pandas as pd

path = "C:\\Users\\nickb\\Desktop\\CCC.xlsx"  # update accordingly

df = pd.read_excel(path)

print df.head()

     Facility Type  Facility Number  \
0  DAY CARE CENTER        197416900   
1  DAY CARE CENTER        191607790   
2  DAY CARE CENTER        197416698   
3  DAY CARE CENTER        304370894   
4  DAY CARE CENTER        384001195  
...

Python Pandas CParserError错误标记数据

1 个答案: