大家好!
我想创建一个名为df的(熊猫)数据集。这个df熊猫形式必须包含" Id"和"功能"列。关于如何做的任何想法?
我已经完成了以下代码,但是...... @@ dictionaries很乱,随机放入两列。我想要" Id"作为第一列和"功能"作为第二个。
提前谢谢!周末度过一个悠闲的时光!
df = DataFrame({'Feature': X["Feature"],'Id': X["Id"] })
答案 0 :(得分:0)
如果这是你想要的?
import pandas as pd
data=["id","Feature"]
index=[1,2]
s = pd.Series(data,index=index)
df = pd.DataFrame(np.random.randn(2,2), index=index, columns=('id','features'))
数据框:
>>> df['id']
1 0.254105
2 -0.132025
Name: id, dtype: float64
>>> df['features']
1 0.189972
2 2.262103
Name: features, dtype: float64
答案 1 :(得分:0)
从pandas docs"如果没有传递列,则列将是dict键的排序列表。"我做这个简单的技巧来安排列。只需在列名开头添加" 1"," 2"等。例如:
>>>> df1 = pd.DataFrame({"Id":[1,2,3],"Feature":[5,6,7]})
>>>> df1
Feature Id
0 5 1
1 6 2
2 7 3
>>>> df2 = pd.DataFrame({"1Id":[1,2,3],"2Feature":[5,6,7]})
>>>> df2
1Id 2Feature
0 1 5
1 2 6
2 3 7
>>>> df2.columns = ["Id","Feature"]
>>>> df2
Id Feature
0 1 5
1 2 6
2 3 7
现在您拥有打印或保存DataFrame所需的订单。