在线阅读csv,错误标记数据

时间:2017-12-19 08:55:33

标签: python pandas csv numpy parsing

.csv格式的数据文件可以在本地计算机中成功获取。

df = pd.read_csv("./data.csv") 

enter image description here

文件上传here

但是,我使用两种方法在Dropbox或Github中上传数据,读取过程全部发生错误如下:

df = pd.read_csv("https://www.dropbox.com/s/2ew62yi0v07tjub/data-1.csv?dl=0")     
  

错误:     pandas.parser.TextReader.read中的pandas / parser.pyx(pandas / parser.c:10364)()     pandas.parser.TextReader._read_low_memory中的pandas / parser.pyx(pandas / parser.c:10640)()   pandas.parser.TextReader._read_rows中的pandas / parser.pyx(pandas / parser.c:11386)()   pandas.parser.TextReader._tokenize_rows中的pandas / parser.pyx(pandas / parser.c:11257)()   pandas.parser.raise_parser_error中的pandas / parser.pyx(pandas / parser.c:26979)()   CParserError:标记数据时出错。 C错误:第3行预期有1个字段,见2

df = pd.read_csv("https://github.com/envhyf/Notebook/blob/master/data-1.csv")  
  

CParserError:标记数据时出错。 C错误:第116行预计有1个字段,见3

因此,我的问题是为什么csv文件可以在我自己的计算机中读取,但在云中失败了?

如何解决此问题。我通过添加error_bad_lines=False尝试了this question的答案。但它对我没用。

1 个答案:

答案 0 :(得分:1)

对于github,您可以使用raw数据:

df = pd.read_csv("https://raw.githubusercontent.com/envhyf/Notebook/master/data-1.csv")

对于dropbox需要dl=1,来自this的信息:

df = pd.read_csv("https://www.dropbox.com/s/gcn75c65222dtfk/data-1.csv?dl=1")