我在python中有一个列表列表。我试图将其转换为数据帧。例如=
foo = [
[1,2,3...],
[a,b,c...],
[aa,bb,cc...]
]
这3个清单中的每一个都有100个元素。我已尝试以下方法转换为数据框 -
df = pandas.DataFrame(foo, columns=headers) // where headers is ['id', 'fname', 'lname']
df = pandas.DataFrame(foo, columns=[foo[0], foo[1], foo[2]])
但是我收到了这个错误 -
AssertionError: 3 columns passed, passed data had 100 columns
答案 0 :(得分:6)
您可以尝试以下方法。该错误来自于使用pandas.DataFrame
构造函数时每个子列表被解释为一行的事实。您可以从标题和列表中创建字典:
import pandas as pd
headers = ['id', 'fname', 'name']
df = pd.DataFrame(dict(zip(headers, foo)))
df
#fname id lname
#0 a 1 aa
#1 b 2 bb
#2 c 3 cc
#3 d 4 dd
#4 e 5 ee
或转置清单:
df = pd.DataFrame(list(zip(*foo)), columns=headers)
df
# id fname lname
#0 1 a aa
#1 2 b bb
#2 3 c cc
#3 4 d dd
#4 5 e ee
答案 1 :(得分:1)
您还可以尝试DataFrame.from_records
转置数据框:
In [17]: df = pd.DataFrame.from_records(foo).T
In [18]: df
Out[18]:
0 1 2
0 1 a aa
1 2 b bb
2 3 c cc
In [19]: df.columns = ['id', 'fname', 'lname']
In [20]: df
Out[20]:
id fname lname
0 1 a aa
1 2 b bb
2 3 c cc