我在将值切换的点处分割pd.DataFrame(或pd.Series)时遇到问题。
例如,我有一个像
这样的数据list('AAAAABBBBBAAABBBCCCCBBBBAAAAA')
如你所见,As和Bs和Cs是按块排列的。
管理细分市场的最灵活方式是什么?
我相信代码会生成类似于数组的数据:
list('00000111112223334445555666677777')
这是段的名称列表。
答案 0 :(得分:1)
大多数pythonic方式都是使用itertools.groupby()
但是你的输出格式需要一些工作,因为它只包含10个数字(0-9)字符 11'之间的区别。和' 1'当它重复几次这样的时候。