在python列pandas中识别有效的url

时间:2017-12-15 00:03:16

标签: python python-2.7 pandas

我有一个包含网址列

的数据框

有效网址应包含http://www.validurl.com。所有其他应该是无效的URL 我需要添加另一个列,显示URL无效

ID   URL 
1    http://www.validurl.com/sports
2    http://www.validurl.com
3    Nan
4    http://www.invalidurl.com

输出应该是

ID   URL                        Error message
1    http://www.validurl.com/sports
2    http://www.validurl.com
3    Nan                           Invalid
4    http://www.invalidurl.com     Invalid

1 个答案:

答案 0 :(得分:0)

您可以使用np.where来执行以下操作

df['Error Message'] = np.where(df['URL'] == 'http://www.validurl.com', ' ', 'Invalid')
print df

导致

  ID                        URL    Error Message
0   1    http://www.validurl.com         
1   2    http://www.validurl.com         
2   3                        Nan  Invalid
3   4  http://www.invalidurl.com  Invalid