xcode - 从html代码中提取文本

时间:2012-04-08 15:50:18

标签: html objective-c xcode

我正在开发一个应用程序,它将SharePoint列表中的数据读入数组。我正在将这些数据显示在屏幕上作为文本字段。但是,其中一个导入的数据字段以html标记代码格式化,例如

<div class="ExternalClass7E8EC81DFF944C7BB81DA896086ABDFF"><p> </p>
<div><span style="font-size:12pt"><font face="Calibri">Project Completion Date (A05-A07) <span>  </span><span>  </span>15<sup>th</sup> May 2012</font></span></div>
​ <p> </p></div>

有谁知道如何从中提取文本内容?另外,也许我应该将这些数据显示为屏幕上的网页?如果是这样,有人能指出我正确的方向吗?

非常感谢您的帮助...

1 个答案:

答案 0 :(得分:2)

发布的HTML使用“实体”代码进行编码。因此,第一个任务是解码那些以回到实际的HTML。您可以使用CFXMLCreateStringByUnescapingEntities()

您可以使用NSXMLDocumentTidyHTML选项从结果中创建NSXMLDocument。您可以请求-stringValue来获取纯文本。

或者,您可以使用-initWithHTML:documentAttributes:创建NSAttributedString。