Objective-C:从字符串中剥离HTML标记

时间:2012-05-31 19:29:22

标签: objective-c ios regex

  

可能重复:
  Remove HTML Tags from an NSString on the iPhone
  Strip out HTML Tags etc from NSString

我在JSON词典中返回一些字符串,如下所示:

"<p>There are <span class=\"top-color-red\">7</span> magical worlds ahead!</p>"

在Objective-C和Foundation框架中,有没有办法剥离所有标签和HTML cruft以显示字符串,因为它将被呈现?

There are 7 magical worlds ahead!

如果这需要使用外部库,您是否可以发布带有我的字符串的代码片段作为示例?

谢谢!

1 个答案:

答案 0 :(得分:3)

如果可以信任字符串格式良好,最简单的选择可能是使用NSXMLParser;实现委托方法-parser:foundCharacters:,使用累加器来收集文档片段的文本内容。

如果您不能相信它们是格式良好的XML,但可以信任它们是有效的HTML;您可以使用NSAttributedString及其-initWithHTML:documentAttributes:方法,并在创建后从字符串中提取文本。

如果您不相信它是有效的HTML;逃跑。

非常非常快。