使用javascript从网页查找文本

时间:2014-08-19 00:55:15

标签: javascript

我想制作一个剧本,但我找不到解决方案。

我正在尝试从网站上找到一个字符串。这里很难的部分是我不能使用

document.documentElement.innerHTML.search("string") 

由于我不能在本地做,我想使用这样的东西:

var link = "myweb.com"
link.documentElement.innerHTML.search("string")

目前,我的脚本会生成链接,打开并关闭它:我只需要在网页上搜索“错误”这个词。

2 个答案:

答案 0 :(得分:0)

如果您需要它只是为了在您的计算机上工作,您可以制作一个可以轻松完成此操作的用户脚本。如果您希望它作为托管网站的一部分工作,则需要服务器端解决方案

答案 1 :(得分:0)

在客户端浏览器中运行的Javascript实际上无法为您检索其他网站的HTML(除非它是您自己网站上的其他页面)。您可能想了解Same-Origin Policy

但是,您可以使用 javascript作为语言来执行您想要的操作 - 只是不在浏览器内部运行。你可以使用名为Node.js的东西,它只是一个程序,可以用来在浏览器之外运行javascript。

它真正归结为如果你想要scrape另一个网站(这是你想要做的术语),你通常需要制作一个在上运行的刮刀服务器,而不是浏览器

要完成,刮掉另一个网站的一种(可能是阴暗的)方法是:

  1. 让您的服务器端代码获取另一个网站的网站
  2. 使用AJAX将内容传递到客户端的浏览器
  3. 让客户完成所有处理
  4. 可选择将已删除的信息发送回您的服务器
  5. 这是使用nodeJS进行抓取的good article