检测网站的背景颜色

时间:2012-11-25 04:20:59

标签: java python html

我正在尝试检测网页中不同元素的颜色(保存在机器上)。目前我正在尝试在python中编写代码。我遵循的最初方法是:

  1. 使用正则表达式在不同的标签中找到html文件中的颜色词。
  2. 尝试读取十六进制值。
  3. 但这种做法非常愚蠢。我是网站设计的新手,请你帮帮我。

3 个答案:

答案 0 :(得分:1)

可以有多个样式表和许多级联样式。您不知道哪些元素最终成为“背景”元素。我想如果你正在寻找可以在大多数网页上运行的强大功能,你需要利用浏览器渲染引擎并专注于识别用户会看到什么。

考虑使用网络浏览器渲染页面,拍摄屏幕截图,然后进行图像处理以找到页面两侧附近最常见的颜色。您可以使用像phantomjs这样的可编写脚本的浏览器。

如果你是编程新手,那么这种方法将会让你头脑发热。

答案 1 :(得分:0)

在java中,您可以使用JSOUP。它非常好

Document doc = Jsoup.connect("http://YourPage.html").get();
Elements colors = doc.select("[bgcolor]"); 

答案 2 :(得分:-1)

我对Java或Python一无所知,但是你可以解析html代码并寻找像'background-color:<颜色>'?