我想提取HTML标签中包含的一些文字。例如:
<html><body>this is a warning message. wrongs values</body></html>
结果应该通过忽略所有HTML标记来获取消息。
有没有人有任何建议?
答案 0 :(得分:1)
你想要这样的东西:
a = sscanf('<html><body>this is a warning message. wrongs values</body></html>','<html><body>%[a-zA-Z., ]</body></html>')
答案 1 :(得分:1)
您可以strip HTML tags使用正则表达式:
str = '<html><body>this is a warning message. wrongs values</body></html>';
str2 = regexprep(str, '<[^>]*>', '')