如何根据python的组合字符串找到正确的网站链接

时间:2017-07-12 09:26:48

标签: python

我有一个名字和名字的列表应该用于撰写网站链接。但有时一些用户并不总是遵循命名规则,最后,他们的网站名称与预期的网站名称不能正确匹配。

以下是一个示例:至少可以说名称为John,姓氏为Paul。在这种情况下,网站网址应为johnpaul.com。但有时,请使用放置johnpaul.compauljohn.comjohn-paul.com

我想自动化这些网站上的某些流程。绝大多数都是正确的,但有些则不正确。当它不正确时,我只是谷歌预期的URL,它通常是我在谷歌上获得的第一个或第二个结果。

我问自己是否有可能发出Google请求并检查2或3个第一个链接python以获取实际的URL。关于如何制作这样的东西的任何想法?

我的代码现在看起来像这样:

for value in arr:

   try:
      print requests.get(url).status_code, url
   except Exception as e:
      print url, " is not available"

1 个答案:

答案 0 :(得分:1)

我会选择endswith()

string = "bla.com"
strfilter = ('.com', '.de') # Tuple
if string.endswith(strfilter):
    raise "400 Bad Request"
通过这种方式,您可以过滤掉.com .net等错误。