我在使用Python Pandas时遇到的困难之一是对大量列重复相同的编码方案。例如,下面正在尝试在名为data的数据框中创建新的age_b列。如何轻松遍历一长串(100甚至1000个)数字列,执行完全相同的操作,而新创建的列名称是带有前缀或后缀字符串(例如“ _b”)的现有名称。
labels = [1,2,3,4,5]
data['age_b'] = pd.cut(data['age'],bins=5, labels=labels)
通常,我有许多简单的数据框列操作或计算,并且编写代码很容易。但是,我经常想对数十个列重复相同的过程,那是我陷入困境的时候,因为大多数函数或操作都适用于一列,但对许多列却不容易重复。如果有人可以建议一个循环代码“结构”,那就太好了。谢谢!