如何从数据框中删除一起出现的数字和字符串

时间:2018-01-13 07:03:24

标签: regex pandas

如何消除数据框中的字母词

Text       Association
  12-43       KG,JK
  12g         MG,JK
  Main Road   
  12-45        JK,TG
  f12 
  Parallel     Road 

当前代码

matrix = matrix[['Text', 'Association']]         
        import numpy as np
        conditions = [

           matrix ['Text'].isnumeric(),
        matrix ['Text'].str.len() == 1
        ]
        matrix  = matrix [~np.logical_or.reduce(conditions)]

所需输出

Text       Association
Main         Road
Parallel      Road 

2 个答案:

答案 0 :(得分:2)

我认为你需要改变:

String
匹配matrix ['Text'].isnumeric(), 的正则表达式\d

str.contains

number

所有在一起:

matrix ['Text'].str.contains('\d'),

答案 1 :(得分:0)

您可以使用正则表达式删除包含字母单词的行,以匹配以大写字母开头并以小写字母结尾的文本

这行代码就足够了:

matrix = matrix.loc[matrix.Text.str.contains('[A-Z].+?[a-z]')]