如何操纵Joomla!便于屏幕抓取的网站

时间:2009-09-03 21:33:31

标签: joomla screen-scraping

我获得了Joomla的所有者(对Web开发一无所知)的许可!网站从网站上提取文章(真实!)

我从RSS Feed中获取了网址,但Feed不包含全文。

您是否知道如何操纵index.php参数以使文章尽可能干净?

现在的网址如下:

http://www.example.com/index.php?option=com_content&task=view&id=2093&Itemid=1

1 个答案:

答案 0 :(得分:3)

更改您的网址以使用“index2.php”而不是“index.php”。这将剥夺所有导航并仅使用文章的内容。

http://www.example.com/index2.php?option=com_content&task=view&id=2093&Itemid=1