我正在尝试扫描网页并获取以下信息:
对于每个包含颜色的块(例如:“div”,“p”,“a”等...)我想得到:
1)文字&背景颜色
2)背景颜色区域(以像素为单位)
3)文字的字体大小
这似乎是一件容易的事,但是......
问题:
如您所知,HTML元素是由父母和孩子构成的,颜色将由孩子决定(除非他们没有定义,而且父母正在确定样式..)
所以我运行所有后代并获得他们的风格,以防风格未定义我去了父母并从那里得到它。
但问题是,有时后代没有给我完整的信息(例如“p”标签内的“强”标签 - 在这种情况下,我只会在“p”标签内部加粗文字..) 另一个问题是标签未定义但仍被客户看到(例如“table”标签内缺少“td”标签)。
当然,为了解决这个问题,我可以得到父母并扣除区域但是会非常复杂并且运行时间很长。
我的问题: 还有其他更容易的选项来获取客户看到的颜色区域吗?