仅从熊猫列中获取纯非数字元素

时间:2019-04-17 18:40:28

标签: python regex pandas dataframe data-manipulation

我有一个像这样的数据列:

   Phrase

   A4678LM
   AFNH
   2l6m8
   2312435
   122
   ABC
   HOW
   IS
   Pa805

,依此类推。现在这是python中数据框的一列。我只选择纯非数字值,例如:

  Phrase

   AFNH
   ABC
   HOW
   IS

该列仅包含纯非数字值。我的“熊猫”列的类型是

  

短语:对象类型

我尝试使用以下公式:

df.applymap(np.isreal) 

但是我无法得到结果。我把一切都显示为FALSE。 我如何只获取纯非数字值?

2 个答案:

答案 0 :(得分:1)

您可以尝试以下代码:

cuts = 2 pd.qcut(y,q=cuts, labels=range(1, cuts+1)) 0 1.0 1 1.0 2 1.0 3 NaN 4 2.0 5 2.0 dtype: category Categories (2, int64): [1 < 2]

它仅检查每一行是否包含字母,如果包含,则将其选中。

答案 1 :(得分:1)

使用str.contains

df[~df.Phrase.str.contains('\d+')]
Out[780]: 
  Phrase
1   AFNH
5    ABC
6    HOW
7     IS