Question

我使用jena从dbpedia获得了一些数据，因为jena的输出是基于xml的，所以在某些情况下xml字符需要区别对待，如下所示：

Guns n &amp;#039; Roses

我只是想知道这是什么样的经济？我希望在javascript的帮助下基于上面的编码（r）解码/编码我的输入并将其发送回servlet。

（编辑后如果删除＆amp;和amp之间的空格，你会得到正确的字符，因为在stackoverflow中我找不到办法做到这一点我决定这样做！）

Answer 1

似乎是XML实体编码，数字字符引用（十进制）。

数字字符引用按其Universal Character Set / Unicode代码点引用字符，并使用格式

你的角色是第39号，是撇号：'，也可以用字符实体引用引用：'。

要使用Javascript对此进行解码，您可以使用php.js，其中html_entity_decode()具有get_html_translation_table()功能（请注意，它取决于{{3}}）。

更新：回复你的编辑：基本上是相同的，唯一的区别是它是编码两次（可能是错误的）。 &是符号：&。

Answer 2

这是一个SGML / HTML / XML数字character entity reference。

在这种情况下，对于撇号'。