这是什么样的编码?

时间:2012-05-05 20:27:28

标签: javascript xml jena dbpedia

我使用jena从dbpedia获得了一些数据,因为jena的输出是基于xml的,所以在某些情况下xml字符需要区别对待,如下所示:

Guns n ' Roses

我只是想知道这是什么样的经济? 我希望在javascript的帮助下基于上面的编码(r)解码/编码我的输入并将其发送回servlet。

(编辑后如果删除&和amp之间的空格,你会得到正确的字符,因为在stackoverflow中我找不到办法做到这一点我决定这样做!)

2 个答案:

答案 0 :(得分:2)

似乎是XML实体编码,数字字符引用(十进制)。

  

数字字符引用按其Universal Character Set / Unicode代码点引用字符,并使用格式

您可以在此处获取一些信息:List of XML and HTML character entity references on Wikipedia

你的角色是第39号,是撇号:',也可以用字符实体引用引用:'

要使用Javascript对此进行解码,您可以使用php.js,其中html_entity_decode()具有get_html_translation_table()功能(请注意,它取决于{{3}})。


更新:回复你的编辑:基本上是相同的,唯一的区别是它是编码两次(可能是错误的)。 &是符号:&

答案 1 :(得分:1)

这是一个SGML / HTML / XML数字character entity reference

在这种情况下,对于撇号'