Question

我一直在运行此代码：

df = pd.read_csv('filepath\\out(noid).csv')
g = df.groupby(['date','user_id'])
g = g['business_id'].unique()

我的文件包含有关日期和用户的数据，这些数据转到某个商家ID（以逗号分隔），例如：

18/4/2013年，-6rEfobYjMxpUWLNxszaxQ，cE27W9VPgO88Qxe4ol6y_g 6/1/2013年，EZ0r9dKKtEGVx2CdnowPCw，mVHrayjG3uZ_RLHkLj-AMG 7分之22/ 2013年，fvTivrsJoUMYXnOJw9wZfw，wJr6kSA5dchdgOdwH6dZ2w

然后我执行以下代码：

dataf = pd.DataFrame(g).reset_index()
newdf = dataf['business_id'].apply(lambda x: len(x) > 1)
x1 = dataf['business_id'][newdf]
x1.to_csv('filepath\\output.csv')

我正在寻找转到某些business_ids的日期/ user_id组，至少这似乎有效但我输出文件有问题。我的输出文件，当它为一个组找到超过3个business_id时，它将它们分成不同的行，我不想要这样，因为我以后无法在我的代码中使用它。一个例子是：

26＆＃34; [＆＃39; G0nUhYF2q4tnoOPwCjXLig＆＃39; ＆＃39; nnPrX9mNtV5jKpo2cMjPWQ＆＃39; ＆＃39; ZgWUM594Yqk52IvBgoIrdA＆＃39; ＆＃39; HMr_KN63f6MzM9h8Wije3Q＆＃39; ＆＃39; ripCiWZ0MblMZSLrIKQAKA＆＃39; ＆＃39; jcI4ZPF3-hSUPsnoqRHO4w＆＃39; ＆＃39; 0InQd9vuhRc98OksC3Ks8Q＆＃39; ＆＃39; nC36M3EGG5jDXC6JLh_9EA＆＃39; ＆＃39; pG9AXrNWpjhX8p4Bz7bLrA＆＃39; ＆＃39; BuJ40Y7c_ERYmkQGoFb8zQ＆＃39; ＆＃39; JpHE7yhMS5ehA9e8WG_ETg＆＃39; ＆＃39; rBCX6nU2ub6v8ErfzXyjtg＆＃39; ＆＃39; 9SrR4mkEsyimsimrc-vP4w＆＃39;]＆＃34;

当我希望他们所有人都在一行而不是分开的行。任何帮助将不胜感激！

Python / n分隔行

0 个答案: