定期抓取Feed xml并使用Bash脚本从Xml获取特定字段

时间:2014-07-07 04:39:48

标签: xml bash rss

我有一个应用程序需要定期从Feed服务器抓取,让新闻网站然后解析Feed xml以打印特定的Feed。

让新闻Feed网址为:http://www.dailystar.com.lb/RSS.aspx?id=113

我想提取项目/标题,项目/描述和项目/类别字段。 我将在特定时间间隔后抓取Url并解析xml并打印此字段,如何使用Bash脚本执行此操作?

1 个答案:

答案 0 :(得分:0)

对于定期执行任务,您应该使用cron实用程序,this question中对此进行了详细解释。使用此选项可以将脚本设置为按指定的时间间隔运行。

bash中的XML解析在this question中有一个相当冗长的示例,您应该能够在此站点上找到其他示例。