在数据框列中仅保留字符串

时间:2019-11-25 11:20:26

标签: python-3.x pandas dataframe

在此df中,我只希望将字符串保留在每一行中,并委托其他所有内容

     Values          
0   99;3;;Sicherheitstür (0SS4.2) bei Anfang Boxen...
1   100;3;;Sicherheitstür (0SS4.2) bei Anfang Boxe...
3   145;3;;Sicherheitstür (0SS3b.5) bei Einspeisef...
4   95;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
5   96;3;;Sicherheitstür (0SS3b.5) vor Boxen unten...
6   30;3;;Anlage ausgeschaltet (Schlüsselschalter ...
7   37;3;;Sicherheitsbereich 5 (Paketierung) ausge...

I found this answer here

但出现语法错误


  File "<ipython-input-17-a2c397c4c493>", line 1
    df = df[df['Value'].apply(lambda x: isinstance(x, basestring)]
                                                             ^
SyntaxError: invalid syntax

1 个答案:

答案 0 :(得分:1)

在python 3中,使用str代替basestring

 df = df[df['Value'].apply(lambda x: isinstance(x, str))]

如果要先提取所有字符串值,然后计数:

s = df['Values'].str.extractall('([a-zA-Z]+)')[0].value_counts()
print (s)
SS                    5
Sicherheitstur        5
b                     3
bei                   3
Boxen                 3
unten                 2
Anfang                2
vor                   2
ausge                 1
Boxe                  1
Anlage                1
Sicherheitsbereich    1
Einspeisef            1
ausgeschaltet         1
Paketierung           1
Schlusselschalter     1
Name: 0, dtype: int64