我有两个数据框。形状为(3446,7)的df1和形状为(1908,7)的df2。 我在这里计算每个数据帧两列的每一行之间的欧式距离(Compute Euclidean distance between rows of two pandas dataframes),因此我为每个可能的对计算欧式距离。因此,我最终得到一个形状为数据的数据帧(3446,1908)。这是我的代码:
import scipy.spatial
distances = scipy.spatial.distance.cdist(df1.iloc[:,3:5], df2[:,3:5], metric='euclidean')
我想增加一个变量的权重(df1的第4列和df2的第4列)。在不增加过多计算成本的情况下怎么可能?