用MATLAB忽略一些字符串

时间:2012-06-07 14:38:02

标签: html string parsing matlab

我想提取HTML标签中包含的一些文字。例如:

<html><body>this is a warning message. wrongs values</body></html>

结果应该通过忽略所有HTML标记来获取消息。

有没有人有任何建议?

2 个答案:

答案 0 :(得分:1)

你想要这样的东西:

 a = sscanf('<html><body>this is a warning message. wrongs values</body></html>','<html><body>%[a-zA-Z., ]</body></html>')

答案 1 :(得分:1)

您可以strip HTML tags使用正则表达式:

str = '<html><body>this is a warning message. wrongs values</body></html>';
str2 = regexprep(str, '<[^>]*>', '')