轻松从在线出版物中提取文章文本

时间:2012-02-11 21:59:35

标签: html web-applications rss atom-feed

在最新版本的Safari中,某些网页的地址栏中会出现“阅读器”按钮。当您单击此按钮时,它将为您提供页面上文章的纯文本版本,而不包含任何不属于文章的广告或内容。我想创建一个Web应用程序,当用户输入在线文章的URL(例如,纽约时报的文章)时,它会做类似的事情。

我想知道是否有人猜测Safari中的这个功能是否实现在:

  • 一种复杂的方式,例如通过文章“grepping”并遵循一些算法来猜测要提取的标签等。
  • 一种简单的方法,例如访问仅提供文章文本的某种RSS或Atom订阅源。据我所知,大多数这些提要似乎只提供文章的简短描述和链接,而不是全文。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

这是以复杂的方式完成的。

通读:How to enable iOS 5 Safari Reader on my website?