Python数据框将单击路径行转到列

时间:2015-08-04 04:28:15

标签: python python-2.7 pandas dataframe

我有一个Python Pandas dataFrame,如下所示:

df = pd.DataFrame({'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'direct']})
print df
   id        m
0   1    email
1   1  organic
2   1      cpc
3   2      cpc
4   2   direct

转型后,我想得到

df_transformed = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})
print df_transformed
   id      path
0   1  p1-p3-p2
1   2     p2-p1

请注意,每个ID的页面路径长度可能不同。

我怎么能得到这个?感谢。

1 个答案:

答案 0 :(得分:1)

我不知道,你到底做了什么。

所以,我尝试了更多组合:

1.输入“p”

根据你的答案的修改,我得到:
d = {'id':[1, 1, 1, 2, 2], 'path':['p1', 'p3', 'p2', 'p2', 'p1']}

然后代码是:

import numpy as np
import pandas as pd

d = {'id':[1, 1, 1, 2, 2], 'path':['p1', 'p3', 'p2', 'p2', 'p1']}
o = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})

df = pd.DataFrame(d)
print df
print o

df = df.groupby('id').agg({'path': lambda x: '-'.join(x)})
print df
        path
id
1   p1-p3-p2
2      p2-p1

2.output with“m words”

意思是:

o = pd.DataFrame({'id':[1,2], 'm' :['email-organic-cpc', 'cpc-direct']})

然后代码是:

import numpy as np
import pandas as pd

d = {'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'direct']}
o = pd.DataFrame({'id':[1,2], 'm' :['email-organic-cpc', 'cpc-direct']})

df = pd.DataFrame(d)

print df
print o

df = df.groupby('id').agg({'m': lambda x: '-'.join(x)})
print df
                    m
id
1   email-organic-cpc
2          cpc-direct

3。重新映射 - 从“m”到“p”

(我必须将最后一项direct更改为email,因为重新映射会出错)

import numpy as np
import pandas as pd

d = {'id':[1, 1, 1, 2, 2], 'm':['email', 'organic', 'cpc', 'cpc', 'email']}
o = pd.DataFrame({'id':[1,2], 'path' :['p1-p3-p2', 'p2-p1']})

dictionary = {'email': 'p1', 'cpc': 'p2', 'organic': 'p3'}

df = pd.DataFrame(d)
print df
df = df.replace({'m': dictionary})
df = df.rename(columns = { 'm':'path'})

print df
print o

df = df.groupby('id').agg({'path': lambda x: '-'.join(x)})
print df
        path
id
1   p1-p3-p2
2      p2-p1