基于另一个DataFrame的DataFrame的新列

时间:2018-07-23 09:02:36

标签: python pandas dataframe

我想将“文本”列与B值最接近的第一个DataFrame组合起来。 DataFrames长度不相等。

example

a = np.array(range(10, 35, 5))
b = np.array(range(0, 30, 5)) + 2
b_text = [random.choice(string.ascii_letters) for i in range(len(b))]
df1 = pd.DataFrame(a, columns=['A'])
df2 = pd.DataFrame(list(zip(b, b_text)), columns=['B', 'text'])

1 个答案:

答案 0 :(得分:0)

我认为需要merge_asof

#if problem with different dtypes
#df1['A'] = df1['A'].astype(np.int64)
#df2['B'] = df2['B'].astype(np.int64)

df = pd.merge_asof(df1, df2, left_on='A', right_on='B')
print (df)
    A   B text
0  10   7    R
1  15  12    y
2  20  17    i
3  25  22    a
4  30  27    G