我正试图从www.crossfit.com上检索这块文本。
周一110516
在五分钟内完成尽可能多的回合:
275磅硬拉,3次重复
115磅按压,7次重复
它基本上只是日期(星期一yymmdd),以及锻炼的简短描述。该网站每天更新一次新的锻炼。我想使用python版本编写一个谷歌应用程序,它将自动拉动每日锻炼。我应该从哪里开始?我跟着google的helloworld示例,这和我所知道的html,python和谷歌应用程序一样多。
答案 0 :(得分:2)
不要自己解析HTML,而是使用已提供的XML Feed:http://www.crossfit.com/index.xml。
您可以使用xml.etree.ElementTree在python 2.5中解析XML Feed。