在此df中,我只希望将字符串保留在每一行中,并委托其他所有内容
Values
0 99;3;;Sicherheitstür (0SS4.2) bei Anfang Boxen...
1 100;3;;Sicherheitstür (0SS4.2) bei Anfang Boxe...
3 145;3;;Sicherheitstür (0SS3b.5) bei Einspeisef...
4 95;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
5 96;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
6 30;3;;Anlage ausgeschaltet (Schlüsselschalter ...
7 37;3;;Sicherheitsbereich 5 (Paketierung) ausge...
但出现语法错误
File "<ipython-input-17-a2c397c4c493>", line 1
df = df[df['Value'].apply(lambda x: isinstance(x, basestring)]
^
SyntaxError: invalid syntax
答案 0 :(得分:1)
在python 3中,使用str
代替basestring
:
df = df[df['Value'].apply(lambda x: isinstance(x, str))]
如果要先提取所有字符串值,然后计数:
s = df['Values'].str.extractall('([a-zA-Z]+)')[0].value_counts()
print (s)
SS 5
Sicherheitstur 5
b 3
bei 3
Boxen 3
unten 2
Anfang 2
vor 2
ausge 1
Boxe 1
Anlage 1
Sicherheitsbereich 1
Einspeisef 1
ausgeschaltet 1
Paketierung 1
Schlusselschalter 1
Name: 0, dtype: int64