Question

我得到了＃34;期望的字符串或缓冲区＆＃34;我的简单python文件中的错误。我试图把reddit文章的标题写下来。

from urllib import urlopen
import re


worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/")

collectTitle = re.compile('<p class="title"><a.*>(.*)</a>')

findTitle = re.findall(collectTitle, worldNewsPage)

listIterator = []
listIterator[:] = range(1,3)

for i in listIterator:
    print findTitle
    print

Answer 1

更改

worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/")

到

worldNewsPage = urlopen("https://www.reddit.com/r/worldnews/").read()

另外don't use regex to parse html。您可以使用BeautifulSoup

Answer 2

Urlopen是一个对象，所以你必须调用read方法来获取你下载的内容（比如文件）。

Python urlopen＆＃34;期望的字符串或缓冲区＆＃34;

2 个答案: