我是python的新手。我试图抓取一些文字,但它不起作用...... 这是我的代码
def parse(self,response):
hxs = Selector(response)
article_list = hsx.xpath('//*[@id="weather"]')
print('##################### total_length : ' + str(len(article_list)))
for a in article_list:
html_response = HtmlResponse(uurl="", body=a.encode('utf-8') #??
seoul = html_response.xpath('//dl[@class="po_seoul"]//dd[@class="temp"]')[0].extract()
这是html代码。
<h1 class="blind">weather_data</h1>
<div id="weather" class="weather" >
<dl class="po_seoul">
<dt>seoul</dt>
<dd class="weather"><a href="#" onclick="showLandForecast('1159068000'); return false;" data-stn="108"><img src="/images/icon/NW/NB04.png" alt="cloud" /></a></dd>
<dt class="blind">temperature</dt>
<dd class="temp">21.2</dd>
</dl>
错误讯息:
seoul = html_response.xpath('//dl[@class="po_seoul"]//dd[@class="temp"]')[0].extract()
^
SyntaxError: invalid syntax
请帮助我... T0T
答案 0 :(得分:0)
在)
之后,您遗漏了HtmlResponse(uurl="", body=a.encode('utf-8')
HtmlResponse(uurl="", body=a.encode('utf-8'))
^
而不是你拥有的