我正在使用feed解析器来获取rss对象。我跑的时候
live_leak.links
我得到了
[{'type': 'text/html', 'rel': 'alternate', 'href':
'http://www.liveleak.com/view?i=abf_1476121939'},
{'type': 'application/x-shockwave-flash', 'rel': 'enclosure', 'href':
'http://www.liveleak.com/e/abf_1476121939'}]
但是当我尝试这个时
live_leak.links[1]
我得到列表索引超出范围,请注意,这是在早些时候工作然后突然间这不起作用。我在我的代码中有这个,我花了几个小时才找到,因为我没有意识到这是不起作用的。如果没有人知道我会做一个字符串替换作为黑客,但我宁愿做已经工作的。
这也有效
live_leak[0]
它返回
[{'type': 'text/html', 'rel': 'alternate', 'href':
'http://www.liveleak.com/view?i=abf_1476121939'}]
这很奇怪,因为另一个不起作用
def pan_task():
url = 'http://www.liveleak.com/rss?featured=1'
name = 'live leak'
live_leaks = [i for i in feedparser.parse(url).entries]
the_count = len(live_leaks)
ky = feedparser.parse(url).keys()
oky = [i.keys() for i in feedparser.parse(url).entries][:12] # shows what I can pull
try:
live_entries = [{
'html': live_leak.links,
'href': live_leak.links[0]['href'],
'src': live_leak.media_thumbnail[0]['url'],
'text': live_leak.title,
'comments': live_leak.description,
'url': live_leak.links[0]['href'],
'embed': live_leak.links[1]['href'],
'text': live_leak.title,
'comments': live_leak.description,
'name': name,
'url': live_leak.link, # this is the link to the source
'author': None,
'video': False
} for live_leak in live_leaks]
except IndexError:
print('error check logs')
live_entries = []
# for count, elem in enumerate(live_entries):
# the_html = requests.get(live_entries[count]['url']) # a specific text
return print(live_entries[0])
答案 0 :(得分:0)
您可以索引 live_leak ,但 live_leak.links 似乎是返回 live_leak 元素的其他类型的构造。尝试 live_leak [1] ,也许?
答案 1 :(得分:0)
一个是在live_leak下查找链接,另一个是查看live_leak本身。
例如: live_leak [1]
应该返回: [{'type':'application / x-shockwave-flash','rel':'enclosure','href': 'http://www.liveleak.com/e/abf_1476121939'}]