从html页面获取所有文本和背景颜色

时间:2013-09-07 17:28:07

标签: javascript html css dom

我正在尝试扫描网页并获取以下信息:

对于每个包含颜色的块(例如:“div”,“p”,“a”等...)我想得到:

1)文字&背景颜色

2)背景颜色区域(以像素为单位)

3)文字的字体大小

HTML structure

这似乎是一件容易的事,但是......

问题:

如您所知,HTML元素是由父母和孩子构成的,颜色将由孩子决定(除非他们没有定义,而且父母正在确定样式..)

所以我运行所有后代并获得他们的风格,以防风格未定义我去了父母并从那里得到它。

但问题是,有时后代没有给我完整的信息(例如“p”标签内的“强”标签 - 在这种情况下,我只会在“p”标签内部加粗文字..) 另一个问题是标签未定义但仍被客户看到(例如“table”标签内缺少“td”标签)。

当然,为了解决这个问题,我可以得到父母并扣除区域但是会非常复杂并且运行时间很长。

我的问题: 还有其他更容易的选项来获取客户看到的颜色区域吗?

0 个答案:

没有答案