我正在尝试在网站上找到一个链接,然后在新标签中打开该链接。如果我在注释中隐藏我的代码并告诉它在chrome中的新选项卡中打开链接它可以工作但是添加if语句并且它就像它没有找到源代码中我知道的那样。有什么想法吗?
import os
import sys
import webbrowser
from bs4 import BeautifulSoup
import urllib2
url='https://twitter.com/nikestore'
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
for tag in soup.find_all('a'):
tag.get('href')
if tag.has_attr('http://t.co/'):
link=tag
webbrowser.open_new_tab(link)
答案 0 :(得分:1)
您将整个Element
(<a href="...">
)传递到此处。您忘记分配 tag.get('href')
结果:
for tag in soup.find_all('a'):
link = tag.get('href')
if 'http://t.co/' in link:
webbrowser.open_new_tab(link)
您可以使用正则表达式匹配来简化循环:
import re
for tag in soup.find_all('a', href=re.compile('^http://t\.co/')):
link = tag['href']
webbrowser.open_new_tab(link)