我有一个Dataframe:
seek()
为了保护此数据集中个人的隐私,我想在这样的Jupyter笔记本中屏蔽此Dataframe的输出:
ID Name Salary($)
0 Alex Jones 44,000
1 Bob Smith 65,000
2 Peter Clarke 50,000
单独替换每个名字中的字符对我来说似乎很粗糙。必须有更好的方法吗?
答案 0 :(得分:3)
您可以使用str.replace
替换每个名称的剩余切片中的所有字符的结果连接第一个字符:
In[16]:
df['Name'] = df['Name'].str[0] + df['Name'].str[1:].str.replace('\w','X')
df
Out[16]:
ID Name Salary($)
0 0 AXXX XXXXX 44,000
1 1 BXX XXXXX 65,000
2 2 PXXXX XXXXXX 50,000