我使用jena从dbpedia获得了一些数据,因为jena的输出是基于xml的,所以在某些情况下xml字符需要区别对待,如下所示:
Guns n ' Roses
我只是想知道这是什么样的经济? 我希望在javascript的帮助下基于上面的编码(r)解码/编码我的输入并将其发送回servlet。
(编辑后如果删除&和amp之间的空格,你会得到正确的字符,因为在stackoverflow中我找不到办法做到这一点我决定这样做!)
答案 0 :(得分:2)
似乎是XML实体编码,数字字符引用(十进制)。
数字字符引用按其Universal Character Set / Unicode代码点引用字符,并使用格式
您可以在此处获取一些信息:List of XML and HTML character entity references on Wikipedia。
你的角色是第39号,是撇号:'
,也可以用字符实体引用引用:'
。
要使用Javascript对此进行解码,您可以使用php.js
,其中html_entity_decode()
具有get_html_translation_table()功能(请注意,它取决于{{3}})。
更新:回复你的编辑:基本上是相同的,唯一的区别是它是编码两次(可能是错误的)。 &
是符号:&
。
答案 1 :(得分:1)
这是一个SGML / HTML / XML数字character entity reference。
在这种情况下,对于撇号'
。