我正在尝试学习Python,并开始尝试将给定文件夹中的特定csv文件导入Python数据类型,然后进一步处理数据。 我正在努力解决需要将数据导入Python的部分。我需要这个有效率。我尝试了几个方法,并根据论坛和其他网页中提供的建议尝试了几种方法 - 所有这些都导致了一个问题或其他问题。如果任何人可以帮助解决这个问题,将非常感谢帮助。
注意:我已经将pandas导入为pd
方法1 :
DF = pd.read_csv(FilePath)
这会产生以下错误:
标记数据时出错。 C错误:第13行预计有1个字段,见2
方法2:
DF = pd.read_csv(FilPath, skiprows=3)
这也会产生同样的错误:
标记数据时出错。 C错误:第13行预计有1个字段,见2
方法3:
data = pd.read_csv(FilePath, error_bad_lines=False)
这会跳过每一行,每行读一个字符。这使得处理数据变得更加困难。
https://dl.dropboxusercontent.com/u/32778128/Test.csv
如果有任何人有任何建议来解决这个问题,我将非常感谢你的帮助。
最佳û
答案 0 :(得分:1)
当您说" DataFrame"您应该使用的是Pandas库。 Pandas为您提供了Pandas DataFrame,您可以轻松地操作导入的csv文件并开始操作数据。你应该专门研究pandas.read_csv函数。它会做你要求的,甚至更多。查看" skiprows"如果需要按行过滤,请参数。
您可以通过执行以下操作来获取DataFrame对象:
import pandas
df = pandas.read_csv('boing.csv') # Creates dataframe from specified CSV file
如果你需要更多,那么你可以参考上面链接的文档,pandas.read_csv需要太多的参数来列出这里。我希望这会有所帮助。
skiprows
的示例:
df = pandas.read_csv('boing.csv', skiprows=2)
这将为您提供一个跳过CSV文件前两行的DataFrame。您可以将2更改为任意数量的标题。使用skiprows
时,请确保您没有跳过代表文件中实际数据的行。