仅包含脚本标记的Html文件

时间:2016-06-03 11:59:11

标签: php html go

我正在使用golang开发网站抓取工具。当我试图抓取一些网站时,我得到了奇怪的结果。某个网站的根网址返回脚本标记,如下所示。

<script>window.location="index.php";</script>

它重定向到index.php页面。为什么人们使用这种方法将用户重定向到索引页面。这种方法有什么安全漏洞吗?而且,我如何在爬虫中处理这种情况?

1 个答案:

答案 0 :(得分:-1)

好吧,如果你真的想通过将用户重定向到另一个页面来隐藏页面,那么你显然不能使用这种方法,因为任何人都可以关闭javascript并查看页面,因此这可能存在安全风险。但是,如果您只是因为某种原因想要重定向,那就没关系了。

对于您的爬虫,您可以做的是使用正则表达式搜索源代码以进行重定向,但覆盖所有情况可能非常具有挑战性。