基本上我试图与How to generate a list from a pandas DataFrame with the column name and column values?
相反借用这个例子,我想从形式出发:
data = [['Name','Rank','Complete'],
['one', 1, 1],
['two', 2, 1],
['three', 3, 1],
['four', 4, 1],
['five', 5, 1]]
应输出:
Name Rank Complete
One 1 1
Two 2 1
Three 3 1
Four 4 1
Five 5 1
然而,当我这样做时:
pd.DataFrame(data)
我得到一个数据框,其中第一个列表应该是我的colnames,然后每个列表的第一个元素应该是rowname
编辑:
为了澄清,我希望每个列表的第一个元素是行名。我正在废弃数据,因此它以这种方式格式化......
答案 0 :(得分:22)
执行此操作的一种方法是将列名作为单独的列表,然后仅从pd.DataFrame
的第一个索引中提供 -
In [8]: data = [['Name','Rank','Complete'],
...: ['one', 1, 1],
...: ['two', 2, 1],
...: ['three', 3, 1],
...: ['four', 4, 1],
...: ['five', 5, 1]]
In [10]: df = pd.DataFrame(data[1:],columns=data[0])
In [11]: df
Out[11]:
Name Rank Complete
0 one 1 1
1 two 2 1
2 three 3 1
3 four 4 1
4 five 5 1
如果要将第一列Name
列设置为索引,请使用.set_index()
方法并发送列以用于索引。示例 -
In [16]: df = pd.DataFrame(data[1:],columns=data[0]).set_index('Name')
In [17]: df
Out[17]:
Rank Complete
Name
one 1 1
two 2 1
three 3 1
four 4 1
five 5 1