我有以下功能
def parseTitle(self, post):
"""
Returns title string with spaces replaced by dots
""
return post.xpath('h2')[0].text.replace('.', ' ')
我会看到post
的内容。我已经尝试了我能想到的一切。
如何正确调试内容?这是一个电影网站,我正在翻录链接和标题,这个功能应解析标题。
我确定H @不存在,我该怎么打印/调试呢?
答案 0 :(得分:2)
post
是lxml元素树对象,不是吗?
首先,您可以尝试:
# import lxml.html # if not yet imported
# (or you can use lxml.etree instead of lxml.html)
print lxml.html.tostring(post)
如果不是,则应该从中创建元素树对象
post = lxml.html.fromstring(post)
或者问题只是您应该将h2
替换为//h2
?
你的问题不是很清楚......