如何从网站搜索特定文本,检索并使用谷歌应用程序引擎(python)?

时间:2011-05-16 21:48:35

标签: python google-app-engine

我正试图从www.crossfit.com上检索这块文本。


周一110516

在五分钟内完成尽可能多的回合:

275磅硬拉,3次重复

115磅按压,7次重复


它基本上只是日期(星期一yymmdd),以及锻炼的简短描述。该网站每天更新一次新的锻炼。我想使用python版本编写一个谷歌应用程序,它将自动拉动每日锻炼。我应该从哪里开始?我跟着google的helloworld示例,这和我所知道的html,python和谷歌应用程序一样多。

1 个答案:

答案 0 :(得分:2)

不要自己解析HTML,而是使用已提供的XML Feed:http://www.crossfit.com/index.xml

您可以使用xml.etree.ElementTree在python 2.5中解析XML Feed。