获取另一个html文档并提取其文本

时间:2017-02-12 12:37:47

标签: javascript html

我的任务是编写JavaScript代码以从中提取文本 外部网页并计算文本中每个单词的出现次数。我也得到了这两个假设:

您可以假设该网页与网页位于同一文件系统中 写给练习。

您还可以假设网页包含正确形成的XHTML

我已经从这个网站上的一些类似帖子中找到了如何使用.textContent和.innerText从html获取文本。

我希望用户能够在文本输入中指定网页。

我不明白的是以某种方式获取其他html文档,以便我可以获取文本并解析它。

2 个答案:

答案 0 :(得分:0)

使用jQuery.load()

 var targetDiv = document.getElementById('my-div');
 var input  = $("input");
 $(targetDiv).load(input.value);

答案 1 :(得分:0)

在某人浏览器中执行javascript意味着您要告诉用户为您执行某些操作。为防止您使用该人为自己加载完全外来页面,出于安全原因限制了保护用户和外部站点的内容。如果该外国网站为allowed you to download / parse their content,那么jquery.get就足够了。