我正在从Wordpress帖子中提取文字,这些帖子有一些转义引用,例如
Aunt Maude’s
和一些未转义的unicode引号,如
Legend’s American Grill
我需要将文本格式化为plist才能在iOS应用中显示。 htmlentities在第一个例子中逃脱&符号,如
Aunt Maude’s
所以我尝试解码所有内容,然后对其进行编码,但html_entity_decode无效。此外,htmlentities将引号更改为plist解析器不喜欢的’
。
我真的不知道我在这做什么 - 有什么帮助吗?
答案 0 :(得分:1)
htmlentities()的最后一个参数允许您不重新编码已经编码的实体,所以
htmlentities('...’...', ENT_COMPAT, <YOUR_CHARSET>, false)
应该适合你。