我有一个Python Pandas dataFrame,如下所示:
df = pd.DataFrame({'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'direct']})
print df
id m
0 1 email
1 1 organic
2 1 cpc
3 2 cpc
4 2 direct
转型后,我想得到
df_transformed = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})
print df_transformed
id path
0 1 p1-p3-p2
1 2 p2-p1
请注意,每个ID的页面路径长度可能不同。
我怎么能得到这个?感谢。
答案 0 :(得分:1)
我不知道,你到底做了什么。
所以,我尝试了更多组合:
根据你的答案的修改,我得到:
d = {'id':[1, 1, 1, 2, 2], 'path':['p1', 'p3', 'p2', 'p2', 'p1']}
然后代码是:
import numpy as np
import pandas as pd
d = {'id':[1, 1, 1, 2, 2], 'path':['p1', 'p3', 'p2', 'p2', 'p1']}
o = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})
df = pd.DataFrame(d)
print df
print o
df = df.groupby('id').agg({'path': lambda x: '-'.join(x)})
print df
path
id
1 p1-p3-p2
2 p2-p1
意思是:
o = pd.DataFrame({'id':[1,2], 'm' :['email-organic-cpc', 'cpc-direct']})
然后代码是:
import numpy as np
import pandas as pd
d = {'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'direct']}
o = pd.DataFrame({'id':[1,2], 'm' :['email-organic-cpc', 'cpc-direct']})
df = pd.DataFrame(d)
print df
print o
df = df.groupby('id').agg({'m': lambda x: '-'.join(x)})
print df
m
id
1 email-organic-cpc
2 cpc-direct
(我必须将最后一项direct
更改为email
,因为重新映射会出错)
import numpy as np
import pandas as pd
d = {'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'email']}
o = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})
dictionary = {'email': 'p1', 'cpc': 'p2', 'organic': 'p3'}
df = pd.DataFrame(d)
print df
df = df.replace({'m': dictionary})
df = df.rename(columns = { 'm':'path'})
print df
print o
df = df.groupby('id').agg({'path': lambda x: '-'.join(x)})
print df
path
id
1 p1-p3-p2
2 p2-p1