为iphone webapp自动创建带有“抓取”内容的页面

时间:2013-01-01 16:28:37

标签: web-applications webpage scrape hint

我不确定这是否是正确的部分。

到目前为止,我为意大利足球新闻网站(Pianeta Lecce)制作了一个HTML iphone webapp。

我的webapp有一个tabbar,你可以根据一个主题选择新闻,我成功地设法做到这一点归功于PHP Simple Html DOM Parser(PHP Simple HTML Dom Parser)我曾经从网站上抓取新闻。

现在这是问题: 如果我点击图片的链接和新闻的简短摘要它显然加载了新闻的外部页面。 但这不是我想要的:我想要的是,当我点击新闻时,它应该以某种方式创建一个页面,其新闻内容再次从网站的页面中删除那条新闻(我只需要图片和新闻!)。

我认为这是一个非常可以解决的问题,但我真的不知道什么是实现这一目标的最佳方式,特别是对于简单< /强>

所以我希望你建议我这样做的可行方法以及你将如何做到这一点。还要说明这是一个iPhone网络应用程序

谢谢!

1 个答案:

答案 0 :(得分:0)

我分三步完成:

  1. 从网上抓取内容
  2. 规范化内容并将其添加到数据库
  3. 以数据库
  4. 的已知形式提供新闻详情

    这样,您的应用程序不依赖于您正在抓取的任何网站,因为您提供相同的元素 - 标题,新闻的简短预览和链接 - 您的数据库中存储在您的数据库中的元素。

    除此之外,您还可以更好地控制抓取过程,并能够监控糟糕的新闻。