取代其他方式的情况较少。
在其中一列中,即数据框的“名称”为df,我具有以下数据:
示例输入:
名称
A
A
A
B
B
C
D
df['Name'].value_counts()
A 3
B 2
C 1
D 1
我需要以下格式的输出。
预期输出:
A 3
B 2
Others 2
赞赏python3中的任何代码。预先感谢。
答案 0 :(得分:2)
您需要:
x = list(df['name'].value_counts()[:2].index) # This will fetch top N values
df['name'] = np.where(df['name'].isin(x), df['name'], 'others')
print(df['Name'].value_counts())
输出
A 3
B 2
others 2