我想使用正则表达式从我使用Nodejs检索到的网站html代码中提取一些文本。我收到的文字是这样的:
<body>
...
<p>text with certain format that I want.</p>
...
</body>
我应该如何提取测试并将其存储在变量中?
我这样做的原因是因为我需要从众多页面中检索信息,所以不可能手动完成。
提前非常感谢!
答案 0 :(得分:0)
如果您只是寻找段落的第一个实例,则可以执行此操作,但这只会获取第一段的内容。如果你想要一个特定的段落,你需要一种方法来识别该段落而不是HTML中的每一段。
如果您正在寻找更具体的内容,我们需要更多地了解您尝试做的事情。
var regex = /<p>(.*)?<\/p>/,
html = [your html here],
results = regex.exec(html);
console.log(results); // an array of matches
&#13;
答案 1 :(得分:0)
var text= '<p>text with certain format that I want.</p>';
jQuery('<div>' + text + '</div>').text();