Question

我有一个包含多个列的数据框（raw_data）：

raw_data = {'one': ['A', 'B', 'A', 'C', 'B', 'B', 'A', 'C', 'A', 'B', 'C', 'B'],'two' : [3,4,5,6,2,7,9,12,1,10,11,8],'three': ['bcd','qpv', 'cba','klm','zfv','klm','abc','abc','abc','lmf','fly','zdb'],'four':['cba','klm','tcf','fly','zfb','zdb','pcd','tlm','bcd','klm','mvt','jbm'], 'five':['apple','lemon','banana','water','kiwi','lemon','orange','apple','apple','straw','water','pom']}

df = pd.DataFrame(raw_data, columns = ['one', 'two', 'three','four','five'])

从这个df，我可以生成新的列或直接向第3列和第3列移位5。

输出：

1）Groupby＆＃39; one＆＃39;

2）按两个＆＃39;排序

3）转移＆＃39;三＆＃39; 1级，新栏＆＃39; three_new＆＃39;

4）转移＆＃39;五＆＃39; 1级，新栏目＆＃39; five_new＆＃39;

5）比较四个＆＃39;与＆＃39; three_new＆＃39; ＆安培; ＆＃39;五＆＃39;使用＆＃39; five_new＆＃39;，如果两者都匹配删除第一行＆amp;继续

6）groupby的比较

输出如下：

one two three   four    five
A   3   bcd     cba     apple
A   5   cba     tcf     banana
A   9   abc     pcd     orange
B   2   zfv     zfb     kiwi
B   7   klm     zdb     lemon
B   8   zdb     jbm     pom
B   10  lmf     klm     straw
C   11  fly     mvt     water
C   12  abc     tlm     apple

初始df有12行＆amp;输出df有9行，按上述标准过滤。请帮忙。

由于

通过groupby pandas

0 个答案: