仅捕获一个<div>的网站客户端</div>

时间:2012-08-20 04:57:31

标签: html css parsing geektool

我正试图从我的Halo角色获取一些统计数据到我的桌面上。现在我有一个geektool脚本,将a service record page转换为.png,然后将其放在我的桌面上。但是,我希望只显示 div class =“summary-details”

最好的方法是什么?我正在考虑编写某种python脚本来解析页面,复制必要的样式和内容部分,然后每15分钟左右创建一个新的html文档。但是,我做了一些研究,并了解到不建议使用正则表达式进行解析。我应该用什么来解析页面?我更喜欢使用python的东西。感谢。

1 个答案:

答案 0 :(得分:0)

Beautiful Soup非常适合解析HTML。但是,生成这个div的图像并不容易,因为它出现在网站上。