有什么不对:谷歌应用程序中的lxml.html.parse

时间:2012-01-21 08:54:09

标签: python parsing lxml

这是我的app.yaml:

application: helloworld
version: 1
runtime: python27
api_version: 1
threadsafe: true

handlers:
- url: /.*
  script: helloworld.app

libraries:
- name: lxml
  version: latest

这是helloworld.py:

from google.appengine.api import urlfetch
import lxml.html

down = "http://sc.hkex.com.hk/gb/www.hkex.com.hk/chi/market/sec_tradinfo/stockcode/eisdeqty_c.htm"
file = urlfetch.fetch(down)
print file.content

root = lxml.html.parse(file.content)
data = root.xpath('//tr[@class="tr_normal"]/td[position()=1]')
name = [row.text_content() for row in data]

for code in name:
    print code

当我跑步时:

google_appengine/dev_appserver.py helloworld/

我打开127.0.0.1:8080,我可以看到网站http://sc.hkex.com.hk/gb/www.hkex.com.hk/chi/market/sec_tradinfo/stockcode/eisdeqty_c.htm但是print file.content行的输出错误。

你可以告诉我如何解决这个问题吗?

1 个答案:

答案 0 :(得分:1)

lxml是一个C模块,GAE只支持纯python模块,因此不支持。