我有以下想要阅读的xml:
目前,我尝试使用luaxml来解析包含中文字符的xml。但是,当我使用控制台打印时,结果是中文字符无法正确打印并显示为垃圾字符。
我想问一下是否还有将中文或韩文字符解析为lua表?
答案 0 :(得分:0)
我不认为Lua是这里的问题。远程站点发送的原始数据使用UTF-8进行编码,Lua没有对此进行特殊解释 - 这意味着如果您只是(1)从远程站点读取,并且(2)保存读取的数据,则应该完美地保留它到一个文件。文件中的数据将包含以UTF-8编码的CJK字符,就像发回的远程站点一样。
如果你得到的结果很有趣,那么错误可能在于您用来从远程站点读取的库,或者可能只是在您输出到控制台时显示结果的方式。
答案 1 :(得分:0)
我设法将“ä¸ç¾Ž”转换成中文字符。 我需要做一个额外的步骤,在保存为xml格式之前,必须通过此链接http://forum.luahub.com/index.php?topic=3617.msg8595#msg8595使用此方法转换所有字符串系列。
string.gsub(l,"&#([0-9]+);", function(c) return string.char(tonumber(c)) end)
我想问LuaXML,我遇到过这个方法xml.registerCode(已解码,已编码)
根据该方法,它说
registers a custom code for the conversion between non-standard characters and XML character entities
非标准字符的含义是什么?如何使用它?