在Python中使用re.search和urlopen

时间:2017-03-31 09:20:59

标签: python regex urllib

我有这个脚本:

for url in urls:
    u = urlopen(url).read
    owner_id = re.search(r'ownerId: ([1-9]+)?,', u).group(1)
    id = re.search(r'id: ([1-9]+)?,', u).group(1)

    print(owner_id)
    print(id)

url是网址列表

脚本返回我" TypeError:期望的字符串或类字节对象" 你知道如何解决这个问题吗?

1 个答案:

答案 0 :(得分:1)

不确定您使用的是哪个版本的Python(下面是针对v3 +,针对v2,将urllib替换为urllib2)。

需要输入urllib和美味的汤

import urllib
from bs4 import BeautifulSoup

url = "url address"
html = urllib.request.urlopen(url).read()
soup = BeautifulSoup(html, "lxml")