我有三个数据框。 一个:我要用其他数据填充的房屋的基本地理信息。 两个:从房屋(行)到四个光源(列)之一的距离。 三个:从房屋到光源的相应角度(0-360度)。
一个:
X Y ... Area_Cat UID
0 ...
1 142862.10 391169.10 ... 1 67321NY15
2 143687.10 391063.10 ... 1 67321NY4
3 144728.45 390877.88 ... 1 67321NY6
4 144842.32 391811.89 ... 1 67321NY7
5 145386.77 392740.08 ... 1 67321NY147
[5 rows x 11 columns]
两个:
1 2 3 4
1 1807.04 1894.98 2135.75 2396.95
2 1801.63 1594.55 1606.38 1744.48
3 2323.27 1835.68 1485.06 1317.95
4 1692.7 1084.16 586.009 400.732
5 1880.35 1293.06 842.389 675.357
三个:
1 2 3 4
1 201.011 220.827 236.11 245.66
2 174.359 195.045 216.163 231.166
3 148.368 160.013 176.392 193.942
4 128.085 136.861 159.281 210.549
5 93.5344 83.9145 63.1797 30.3033
我成功使用以下方法设法将最短距离添加到数据框:
for index, row in two.iterrows():
one.loc[index,'Distance'] = min(row)
结果:
X Y ... UID Distance
0 ...
1 142862.10 391169.10 ... 67321NY15 1807.043447
2 143687.10 391063.10 ... 67321NY4 1594.554866
3 144728.45 390877.88 ... 67321NY6 1317.947638
4 144842.32 391811.89 ... 67321NY7 400.732398
5 145386.77 392740.08 ... 67321NY147 675.356557
[5 rows x 12 columns]
现在,我还要添加相应的角度以及列名Orientation
。我的想法是找到min(row)
值的列索引和行索引,并使用它们在第三个数据帧中的值填充新列。我找到了idxmin()
选择器,但几次尝试都失败了。你能帮我吗?
所需结果:
X Y ... UID Distance Orientation
0 ...
1 142862.10 391169.10 ... 67321NY15 1807.043447 201.011
2 143687.10 391063.10 ... 67321NY4 1594.554866 195.045
3 144728.45 390877.88 ... 67321NY6 1317.947638 193.942
4 144842.32 391811.89 ... 67321NY7 400.732398 210.549
5 145386.77 392740.08 ... 67321NY147 675.356557 30.3033
[5 rows x 12 columns]
答案 0 :(得分:2)
我认为使用 idxmin 并从Two获取min索引是一个好主意!
为了使用索引从其他数据帧(例如“三”)获取数据,我使用了 pd.DataFrame.values ,列表理解和 zip 。>
# get the indexes of min values from Two
ix = two.idxmin(axis=1)
# result:
# ix => [ 1, 2, 4, 4, 4 ]
# get the distance and orientation from Two and Three using the above indexes
_two = [two_val[i] for two_val, i in zip(two.values, ix)]
_three = [three_val[i] for three_val, i in zip(three.values, ix)]
# result:
# _two => [ 1807.043447, 1594.554866, 1317.947638, 400.732398, 675.356557 ]
# _three => [ 201.011, 195.045, 193.942, 210.549, 30.3033 ]
# append the result to One (be careful with the 0 index in One)
one["Distance"] = ””
one.loc[1:, ”Distance”] = _two
one["Orientation"] = ””
one.loc[1:, ”Orientation”] = _three
这里我对Two使用了相同的方法(使用Two的idxmin输出获取值),但是您原来的方法也适用。
编辑: 意识到数据框One的索引为0,我在此处附加了一个空字符串