我使用pandas从dataSource.cvs
文件中加载数据:
DF = pd.read_csv('dataSoruce.csv')
在pandas中我可以清理数据,比如用0填充缺失值。
接下来,我使用DF.to_csv('temp.csv', sep=',')
将DF
写为
临时cvs文件,然后使用python文件处理程序再次打开文件
hd = open('temp.csv')
for line in hd:
line = line.split(',').....
解析数据并关联来自其他数据表的更多信息。 这有效。但是,如果我直接做
hd = DF
然后它将错误消息显示为
IndexError: list index out of range
有没有办法跳过保存到cvs和阅读csv?
即直接打开pandas dataFrame
作为文件处理程序?
非常感谢!
答案 0 :(得分:0)
假设DF
是pandas中的数据框,请执行以下操作:
for x in DF.values:
x = tuple(x)
然后x
将为(x1, x2, x3...)
格式。