高效地将自定义CSV文件读入Python

时间:2017-01-22 21:37:26

标签: python csv import

我正在尝试学习Python,并开始尝试将给定文件夹中的特定csv文件导入Python数据类型,然后进一步处理数据。        我正在努力解决需要将数据导入Python的部分。我需要这个有效率。我尝试了几个方法,并根据论坛和其他网页中提供的建议尝试了几种方法 - 所有这些都导致了一个问题或其他问题。如果任何人可以帮助解决这个问题,将非常感谢帮助。

注意:我已经将pandas导入为pd

方法1

DF = pd.read_csv(FilePath)

这会产生以下错误:

  

标记数据时出错。 C错误:第13行预计有1个字段,见2

方法2:

DF = pd.read_csv(FilPath, skiprows=3)

这也会产生同样的错误:

  

标记数据时出错。 C错误:第13行预计有1个字段,见2

方法3:

data = pd.read_csv(FilePath, error_bad_lines=False)

这会跳过每一行,每行读一个字符。这使得处理数据变得更加困难。

https://dl.dropboxusercontent.com/u/32778128/Test.csv

如果有任何人有任何建议来解决这个问题,我将非常感谢你的帮助。

最佳

û

1 个答案:

答案 0 :(得分:1)

当您说" DataFrame"您应该使用的是Pandas库。 Pandas为您提供了Pandas DataFrame,您可以轻松地操作导入的csv文件并开始操作数据。你应该专门研究pandas.read_csv函数。它会做你要求的,甚至更多。查看" skiprows"如果需要按行过滤,请参数。

您可以通过执行以下操作来获取DataFrame对象:

import pandas

df = pandas.read_csv('boing.csv')  # Creates dataframe from specified CSV file

如果你需要更多,那么你可以参考上面链接的文档,pandas.read_csv需要太多的参数来列出这里。我希望这会有所帮助。

skiprows的示例:

df = pandas.read_csv('boing.csv', skiprows=2)

这将为您提供一个跳过CSV文件前两行的DataFrame。您可以将2更改为任意数量的标题。使用skiprows时,请确保您没有跳过代表文件中实际数据的行。