Python urlopen"期望的字符串或缓冲区"

时间:2016-10-15 04:18:00

标签: python rss

我得到了#34;期望的字符串或缓冲区"我的简单python文件中的错误。我试图把reddit文章的标题写下来。

from urllib import urlopen
import re


worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/")

collectTitle = re.compile('<p class="title"><a.*>(.*)</a>')

findTitle = re.findall(collectTitle, worldNewsPage)

listIterator = []
listIterator[:] = range(1,3)

for i in listIterator:
    print findTitle
    print

2 个答案:

答案 0 :(得分:1)

更改

worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/")

worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/").read()

另外don't use regex to parse html。您可以使用BeautifulSoup

答案 1 :(得分:0)

Urlopen是一个对象,所以你必须调用read方法来获取你下载的内容(比如文件)。