为什么我的代码加载浏览器选项卡中的链接不起作用?

时间:2014-03-02 23:07:25

标签: python web-scraping beautifulsoup

我正在尝试在网站上找到一个链接,然后在新标签中打开该链接。如果我在注释中隐藏我的代码并告诉它在chrome中的新选项卡中打开链接它可以工作但是添加if语句并且它就像它没有找到源代码中我知道的那样。有什么想法吗?

import os
import sys
import webbrowser
from bs4 import BeautifulSoup
import urllib2
url='https://twitter.com/nikestore'
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())

for tag in soup.find_all('a'):
    tag.get('href')
    if tag.has_attr('http://t.co/'):
       link=tag
       webbrowser.open_new_tab(link)

1 个答案:

答案 0 :(得分:1)

您将整个Element<a href="...">)传递到此处。您忘记分配 tag.get('href')结果:

for tag in soup.find_all('a'):
    link = tag.get('href')
    if 'http://t.co/' in link:
       webbrowser.open_new_tab(link)

您可以使用正则表达式匹配来简化循环:

import re

for tag in soup.find_all('a', href=re.compile('^http://t\.co/')):
    link = tag['href']
    webbrowser.open_new_tab(link)