Python / n分隔行

时间:2015-11-15 14:24:48

标签: python pandas

我一直在运行此代码:

df = pd.read_csv('filepath\\out(noid).csv')
g = df.groupby(['date','user_id'])
g = g['business_id'].unique()

我的文件包含有关日期和用户的数据,这些数据转到某个商家ID(以逗号分隔),例如:

  

18/4/2013年,-6rEfobYjMxpUWLNxszaxQ,cE27W9VPgO88Qxe4ol6y_g   6/1/2013年,EZ0r9dKKtEGVx2CdnowPCw,mVHrayjG3uZ_RLHkLj-AMG   7分之22/ 2013年,fvTivrsJoUMYXnOJw9wZfw,wJr6kSA5dchdgOdwH6dZ2w

然后我执行以下代码:

dataf = pd.DataFrame(g).reset_index()
newdf = dataf['business_id'].apply(lambda x: len(x) > 1)
x1 = dataf['business_id'][newdf]
x1.to_csv('filepath\\output.csv')

我正在寻找转到某些business_ids的日期/ user_id组,至少这似乎有效但我输出文件有问题。我的输出文件,当它为一个组找到超过3个business_id时,它将它们分成不同的行,我不想要这样,因为我以后无法在我的代码中使用它。一个例子是:

  

26" [' G0nUhYF2q4tnoOPwCjXLig' ' nnPrX9mNtV5jKpo2cMjPWQ'   ' ZgWUM594Yqk52IvBgoIrdA' ' HMr_KN63f6MzM9h8Wije3Q'   ' ripCiWZ0MblMZSLrIKQAKA' ' jcI4ZPF3-hSUPsnoqRHO4w'   ' 0InQd9vuhRc98OksC3Ks8Q' ' nC36M3EGG5jDXC6JLh_9EA'   ' pG9AXrNWpjhX8p4Bz7bLrA' ' BuJ40Y7c_ERYmkQGoFb8zQ'   ' JpHE7yhMS5ehA9e8WG_ETg' ' rBCX6nU2ub6v8ErfzXyjtg'   ' 9SrR4mkEsyimsimrc-vP4w']"

当我希望他们所有人都在一行而不是分开的行。任何帮助将不胜感激!

0 个答案:

没有答案