下载并阅读网页源代码,非法?

时间:2014-04-02 17:55:59

标签: java html

我正在开发一个项目,该项目生成一个有意义的URL,连接到它,并下载其HTML源代码。该程序将进一步阅读源并从中提取有用的信息。这是非法的吗?

2 个答案:

答案 0 :(得分:1)

就你自己而言,没有任何违法行为发生在你所描述的内容中。但你很模糊。

“生成有意义的网址”是什么意思?生成方式如何?什么决定“有意义”?

在请求的URL下载服务器给出的html正是浏览器所做的事情。没什么奇怪的。浏览器还会读取该HTML并从中构建文档以显示给用户。

“从中提取有用的信息”是什么意思?

您如何处理结果信息?

您是否绕过任何安全措施,或者通过大量请求向同一服务器发送垃圾邮件?你在做任何违反某人隐私的事吗?您是否重新发布您收集的任何信息而不回溯其原始来源?

你的项目甚至在你的脑海中引发了一个关于合法性的红旗是什么意思?

这些是你应该问自己的问题。

答案 1 :(得分:0)

如果这是个人项目,那么至少它不是非法的。但是,如果这是针对商业产品的话,我会在尊重网页上任何受版权保护的内容方面犯错误。