Javascript:如何从网页中检索文本

时间:2012-11-03 02:03:43

标签: javascript html dom text web

我想将网页中的文本检索为字符串。这可能吗? 我是Javascript的新手。

例如:

var url = "http://en.wikipedia.org/wiki/Programming";
var result = url.getText();  <---- stores text as a string
document.write(result);

如何编写getText方法?以太整个HTML源代码(我可以使用它来获取文本)或只是文本。我想在网络浏览器中这样做。

我试过这个,我能得到一个索引号:

var url = "http://www.youtube.com/results?search_query=cat&page=2";
var result;
function go(){
    result = url.search(/cat/i);
    document.write(result);
}

这给了我一个44的索引。这意味着可以阅读页面。我可以反过来输入索引来检索文本吗?

3 个答案:

答案 0 :(得分:2)

最好使用更强大的服务器端语言来做到这一点,而不是使用JavaScript。 Python或PHP将是不错的选择。

答案 1 :(得分:2)

Ajax不支持跨域。你需要服务器端语言。

答案 2 :(得分:2)

如果Ajax /跨域情况不适合您,您可以使用

提取网页文本
var el = document.body; // or some other element reference
var text = el.innerText || el.textContent;

如果您需要从与应用程序相同的域中的页面读取文本,则可以直接使用Ajax。

如果您需要从域外的页面阅读文本,则必须跳过几个额外的环节,例如设置代理服务器或处理CORS - http://en.wikipedia.org/wiki/Cross-origin_resource_sharing