所以我仍然在经历大熊猫,这样做有点麻烦
数据集1
Sample Age Tumor Location
3 31 Benign Lung
8 45 Malignant Heart
9 44 Malignant Heart
数据集2
Sample Age Tumor Location
3 None None None
8 None None None
9 None None None
我想要做的是根据样本列将数据从数据集1移动到数据集2,以便正确映射
喜欢
数据集2
Sample Age Tumor Location
3 31 Benign Lung
8 45 Malignant Heart
9 44 Malignant Heart
我似乎找不到一个可以做到这一点的例子。除了将两者合并到一个新的数据框中之外?
答案 0 :(得分:0)
使用update
并假设'Sample'
是地图的唯一键
df2=df2.set_index('Sample')
df2.update(df1.set_index('Sample'))
df2.reset_index(inplace=True)
df2
Out[1046]:
Sample Age Tumor Location
0 3 31 Benign Lung
1 8 45 Malignant Heart
2 9 44 Malignant Heart
答案 1 :(得分:0)
您可以使用loc
(docs)根据行上的条件设置列。下面的示例:
#Setup
import pandas as pd
dataset_1 = {
'Sample': [3, 8, 9],
'Age': [31, 45, 44],
'Tumor': ['Benign', 'Malignant', 'Malignant'],
'Location': ['Lung', 'Heart', 'Heart']
}
dataset_2 = {
'Sample': [3, 8, 9],
'Age': [None, None, None],
'Tumor': [None, None, None],
'Location': [None, None, None]
}
df_1 = pd.DataFrame(dataset_1)
df_2 = pd.DataFrame(dataset_2)
print(df_1)
print(df_2)
哪个输出:
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
Age Location Sample Tumor
0 None None 3 None
1 None None 8 None
2 None None 9 None
这是使用loc
将列设置为相等的方法,其中某列的行与另一列的行相等。
在这种情况下,要比较的列是两个数据帧的Sample
列:
df_2.loc[df_2.Sample == df_1.Sample, :] = df_1
print(df_1)
print(df_2)
哪个给了我们
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
Age Location Sample Tumor
0 31 Lung 3 Benign
1 45 Heart 8 Malignant
2 44 Heart 9 Malignant
我希望这是您要寻找的。祝你好运!