Node.js使用正则表达式从响应中提取某些字符串

时间:2016-08-10 14:15:36

标签: javascript regex node.js extract information-retrieval

我想使用正则表达式从我使用Nodejs检索到的网站html代码中提取一些文本。我收到的文字是这样的:

<body>

...

<p>text with certain format that I want.</p>

...

</body>

我应该如何提取测试并将其存储在变量中?

我这样做的原因是因为我需要从众多页面中检索信息,所以不可能手动完成。

提前非常感谢!

2 个答案:

答案 0 :(得分:0)

如果您只是寻找段落的第一个实例,则可以执行此操作,但这只会获取第一段的内容。如果你想要一个特定的段落,你需要一种方法来识别该段落而不是HTML中的每一段。

如果您正在寻找更具体的内容,我们需要更多地了解您尝试做的事情。

&#13;
&#13;
var regex = /<p>(.*)?<\/p>/,
    html = [your html here],
    results = regex.exec(html);

console.log(results); // an array of matches
&#13;
&#13;
&#13;

答案 1 :(得分:0)

var text= '<p>text with certain format that I want.</p>';
jQuery('<div>' + text + '</div>').text();