我已经完成了给定的解决方案,但是我无法理解这个概念。 我有一个包含3列的数据,并且数据确实很大。我的其中一列包含字母数字名称,例如Apple 4014,橙色40mg / 10。谁能帮助我编写一个函数,该函数采用数据框的列并将除字母以外的所有字符转换为空格。 我将此产品说明作为列名。因此,我可以导入整个列,以便将产品说明下的所有字段都转换为仅文本。这只是虚拟数据。
答案 0 :(得分:3)
我相信您需要使用正则表达式replace
-由class myclass:
def __init__(self, a, b):
if a == b:
self = a
else:
myclass.a = a
myclass.b = b
提取的所有非字母值:
[^a-zA-Z]+
或者:
df = pd.DataFrame({'a':["apple 4014", "orange 40mg/10"]})
df['a'] = df['a'].str.replace('[^a-zA-Z]+', ' ')
print (df)
a
0 apple
1 orange mg