我想制作一个剧本,但我找不到解决方案。
我正在尝试从网站上找到一个字符串。这里很难的部分是我不能使用
document.documentElement.innerHTML.search("string")
由于我不能在本地做,我想使用这样的东西:
var link = "myweb.com"
link.documentElement.innerHTML.search("string")
目前,我的脚本会生成链接,打开并关闭它:我只需要在网页上搜索“错误”这个词。
答案 0 :(得分:0)
如果您需要它只是为了在您的计算机上工作,您可以制作一个可以轻松完成此操作的用户脚本。如果您希望它作为托管网站的一部分工作,则需要服务器端解决方案
答案 1 :(得分:0)
在客户端浏览器中运行的Javascript实际上无法为您检索其他网站的HTML(除非它是您自己网站上的其他页面)。您可能想了解Same-Origin Policy。
但是,您可以使用 javascript作为语言来执行您想要的操作 - 只是不在浏览器内部运行。你可以使用名为Node.js的东西,它只是一个程序,可以用来在浏览器之外运行javascript。
它真正归结为如果你想要scrape另一个网站(这是你想要做的术语),你通常需要制作一个在上运行的刮刀服务器,而不是浏览器。
要完成,刮掉另一个网站的一种(可能是阴暗的)方法是:
这是使用nodeJS进行抓取的good article。