需要帮助打破这个正则表达式

时间:2016-01-07 11:51:18

标签: python regex

所以我找到了一个很好的正则表达式的例子,它可以满足我的需求,但几周之后我再也找不到这个源了,我忘了正确记录我的代码。这段代码可以根据我的需要运行,但是有人可以将它分解成各个部分,这样我就可以理解它在做什么更好,以防我想重用它来做别的事情?我正在读取系统在csv文件中留下的一列备注。

这是取电话号码,格式为(999)999-9999。但是,当数字格式为10位数9999999999时,它也有效。

call['phone_number'] = call['activity'].str.extract('.*?(\(?\d{3}\D{0,3}\d{3}\D{0,3}\d{4}).*?')

这个是在(移动),(工作),(家庭)之类的括号之间进行文本。我注意到,如果由于某种原因,这里没有文本,那么它默认为电话号码的区号(999)。然后我用空格替换那些不正确的字段。

call['call_type'] = call['activity'].str.extract('\((.*?)\)')

0 个答案:

没有答案