我已经解析了网页上的所有“href”链接。我想用浏览器只打开其中一个。我怎样才能做到这一点?

时间:2016-03-12 13:42:05

标签: python html-parsing

我想解析包含单词'cricket'的链接。 这是代码。

import urllib.request
import re
from bs4 import BeautifulSoup
import webbrowser
url = "http://www.thehindu.com/"
def hi():
    dep = urllib.request.urlopen(url)
    soup = BeautifulSoup(dep, "html.parser")
    #to parse links that contain word bangladesh in it
    for link in soup.find_all('a', href=re.compile("bangladesh")):
        tip = link.get('href')
        print(tip)
        webbrowser.open(tip)
hi()

[这是输出。我想用我的webbrowser打开输出的第二个链接(并忽略第一个链接)[1]

![1]:http://i.stack.imgur.com/rPkZi.png

1 个答案:

答案 0 :(得分:1)

如果要打开第二个链接,可以执行以下操作:

for pos, link in enumerate(soup.find_all('a', href=re.compile("bangladesh"))):
    tip = link.get('href')
    print(tip)
    if (pos + 1) == 2:
        webbrowser.open(tip)

Docs on enumerate