绑定熊猫data.frame的值

时间:2017-01-25 09:42:49

标签: python pandas

我正在寻找一种在新变量中将子集中的行添加到一起的方法。

我们假设我们有以下数据集

df = pd.DataFrame(columns=('Body', 'ticketID'))
df2 = pd.DataFrame([["test1", 1], ["test2",1], ["test3",2],  ["test4",2]], columns=('Body', 'ticketID'))
df = df.append(df2)

我创建了独特的data.frames" df_temp"使用ticketID的唯一值

uniqueIDs = df.ticketID.unique()
for u in uniqueIDs:
 df_temp = df2.loc[df['ticketID'] == u]

现在我想创建一个额外的步骤来绑定单独的data.frame的正文值。因此,在ticketID == 1 case - >的情况下" test1 test2"如果是ticketID == 2 case" test3 test4"。

关于如何使用上面的示例实现此目的的任何想法

1 个答案:

答案 0 :(得分:1)

您可以在ID列上使用groupby而在join In [82]: df.groupby('ticketID')['Body'].apply(' '.join) Out[82]: ticketID 1.0 test1 test2 2.0 test3 test4 Name: Body, dtype: object 上使用apply,而不是遍历df:

print