我试图删除任何html标记内的所有内容:
输入:
<a class="yoyo"> <h1 id="test"> hello </h1> </a>
奇怪的例子,但很好
输出:
<a><h1>hello</h1></a>
我试过/(<\w)(?:.*)(>)/gmi
,但它不起作用......
如果你有任何线索。 感谢
所以在你发表评论之后解释一下我取消了一个网站,我有一个.txt文件,我想要清理。它将包含页面的整个html,我想清理每个html标签并删除空格。 所以任何&lt; *和&gt;之间的所有内容都是如此。应该删除。
答案 0 :(得分:0)
以下正则表达式如何:
Select Id, Name, Start_end from #Values
cross apply (
Select top ([end] - [start] +1) Start_end = [start] + Row_number() over (order by (Select NULL))-1
from master..spt_values s1, master..spt_values s2
) a
你必须连接所有的比赛。
答案 1 :(得分:0)
使用DOM方法执行此操作。遍历所有元素,迭代属性并删除它们
let cont = document.getElementById('demo-container'),
els = cont.querySelectorAll('*');
[].slice.call(els).forEach(el => {
[].slice.call(el.attributes).forEach(attr => {
el.removeAttribute(attr.name);
})
});
console.log(cont.innerHTML)
&#13;
<div id="demo-container">
<a class="yoyo">
<h1 id="test"> hello </h1>
</a>
</div>
&#13;