我一直在运行此代码:
df = pd.read_csv('filepath\\out(noid).csv')
g = df.groupby(['date','user_id'])
g = g['business_id'].unique()
我的文件包含有关日期和用户的数据,这些数据转到某个商家ID(以逗号分隔),例如:
18/4/2013年,-6rEfobYjMxpUWLNxszaxQ,cE27W9VPgO88Qxe4ol6y_g 6/1/2013年,EZ0r9dKKtEGVx2CdnowPCw,mVHrayjG3uZ_RLHkLj-AMG 7分之22/ 2013年,fvTivrsJoUMYXnOJw9wZfw,wJr6kSA5dchdgOdwH6dZ2w
然后我执行以下代码:
dataf = pd.DataFrame(g).reset_index()
newdf = dataf['business_id'].apply(lambda x: len(x) > 1)
x1 = dataf['business_id'][newdf]
x1.to_csv('filepath\\output.csv')
我正在寻找转到某些business_ids的日期/ user_id组,至少这似乎有效但我输出文件有问题。我的输出文件,当它为一个组找到超过3个business_id时,它将它们分成不同的行,我不想要这样,因为我以后无法在我的代码中使用它。一个例子是:
26" [' G0nUhYF2q4tnoOPwCjXLig' ' nnPrX9mNtV5jKpo2cMjPWQ' ' ZgWUM594Yqk52IvBgoIrdA' ' HMr_KN63f6MzM9h8Wije3Q' ' ripCiWZ0MblMZSLrIKQAKA' ' jcI4ZPF3-hSUPsnoqRHO4w' ' 0InQd9vuhRc98OksC3Ks8Q' ' nC36M3EGG5jDXC6JLh_9EA' ' pG9AXrNWpjhX8p4Bz7bLrA' ' BuJ40Y7c_ERYmkQGoFb8zQ' ' JpHE7yhMS5ehA9e8WG_ETg' ' rBCX6nU2ub6v8ErfzXyjtg' ' 9SrR4mkEsyimsimrc-vP4w']"
当我希望他们所有人都在一行而不是分开的行。任何帮助将不胜感激!