拉动与新闻文章相关联的缩略图图像

时间:2012-11-03 14:26:15

标签: android

我不确定我是否正确标记了这个问题,但我知道很多新闻应用如Pulse,Google Currents等等都会引用新闻报道的缩略图。我的问题是,我假设他们正在从新闻网站本身提取内容,无论是屏幕抓取还是消费某种类型的Feed。他们如何知道从网站吸引哪些图片?

我用“android”标签标记这个,因为我已经构建了一个新闻阅读器应用程序,我想要提取缩略图。感谢。

2 个答案:

答案 0 :(得分:1)

我前段时间使用这种方法构建了这样的东西:

  1. 带有可读性框架的流程文章(针对Java,Google找到jReadabilitySnacktoryJava-readability - 可能还有更多,其中一个应该在Android上运行,也是)。
  2. 在已处理的文章中,使用某个DOM框架抓取第一个图像以导航到第一个img标记。由于文章是"清洁",这通常是可用的。
  3. 我建议在服务器上进行文章处理,而不是通过电话。

答案 1 :(得分:1)

this article中,讨论了不同的技术。

reddit上执行缩略图提取的一个很好的例子。有关reddit如何识别和裁剪缩略图的详细信息,请herehere