如何从熊猫系列中删除一个或多个字母x?

时间:2020-10-23 14:03:27

标签: python pandas

我一直在尝试从熊猫系列中删除仅包含字母x的单词,但无法正常工作。 如何从熊猫系列中删除像x xx xxx xxxx这样只能包含任意数量x的单词?

我的尝试

import numpy as np
import pandas as pd
pd.set_option('max_colwidth',500)

data = np.array(['transworld system inc trying colect xx xxxx debt mine owed inacurate',
       'complaint cals ocur betwen xx xx xx xx cel job ',
       'company violated',
       'previously xxxx xxxx xxxx requested experian actualy mine xxxx xxxx instead',
       'company xx trans union xx noticed '])
                
                
s = pd.Series(data)
s.str.replace(r'(\sx+\s)',r' ',regex=True)

输出

我期待空格* N可以被一个空格代替,但是它不起作用。 如何解决该问题?

1 个答案:

答案 0 :(得分:2)

您可以将Seq1 = input( " Enter first sequence ") Seq2 = input(" Enter second sequence ") seq1 = list(Seq1) seq2 = list(Seq2) def compare_seq(seq1,seq2): if len(seq1) != len(seq2): print(" The sequences differ by their length ") exit() else: for i in range(len(seq1)) : if seq1[i] == seq2[i]: print(" The sequences are the same ") exit() else : print(" Sequences differ by a/mulitple nucleotide ") exit() compare_seq(seq1,seq2) 用作单词边界,因此\b可以被替换。由于'xxx abcd'x可以交错,您将全部删除,因此您可以使用:

 

输出:

s.str.replace(r'\b[x\s]+\b',' ')
相关问题