lua读汉字

时间:2012-05-08 15:53:43

标签: lua

我有以下想要阅读的xml:

  1. chinese xml - https://news.google.com/news/popular?ned=cn&topic=po&output=rss
  2. korean xml - http://www.voanews.com/templates/Articles.rss?sectionPath=/korean/news
  3. 目前,我尝试使用luaxml来解析包含中文字符的xml。但是,当我使用控制台打印时,结果是中文字符无法正确打印并显示为垃圾字符。

    我想问一下是否还有将中文或韩文字符解析为lua表?

2 个答案:

答案 0 :(得分:0)

我不认为Lua是这里的问题。远程站点发送的原始数据使用UTF-8进行编码,Lua没有对此进行特殊解释 - 这意味着如果您只是(1)从远程站点读取,并且(2)保存读取的数据,则应该完美地保留它到一个文件。文件中的数据将包含以UTF-8编码的CJK字符,就像发回的远程站点一样。

如果你得到的结果很有趣,那么错误可能在于您用来从远程站点读取的库,或者可能只是在您输出到控制台时显示结果的方式。

答案 1 :(得分:0)

我设法将“ä¸ç¾Ž”转换成中文字符。 我需要做一个额外的步骤,在保存为xml格式之前,必须通过此链接http://forum.luahub.com/index.php?topic=3617.msg8595#msg8595使用此方法转换所有字符串系列。

string.gsub(l,"&#([0-9]+);", function(c) return string.char(tonumber(c)) end)

我想问LuaXML,我遇到过这个方法xml.registerCode(已解码,已编码)

根据该方法,它说

registers a custom code for the conversion between non-standard characters and XML character entities

非标准字符的含义是什么?如何使用它?