使用Lua使用unicode字符进行字符串格式化

时间:2016-08-18 03:25:50

标签: lua string.format unicode-string

我尝试将字符串与unicode字符对齐。
但它不起作用 空间不正确。 :(
Lua的版本是5.1 有什么问题?

local t = 
{
    "character",
    "루아",           -- korean
    "abc감사합니다123", -- korean
    "ab23",
    "lua is funny",
    "ㅇㅅㅇ",
    "美國大將",         --chinese
    "qwert-54321",
};

for k, v in pairs(t) do
    print(string.format("%30s", v));
end


result:----------------------------------------------
                     character  
                        루아  
          abc감사합니다123   
                          ab23  
                  lua is funny  
                      ㅇㅅㅇ   
                   美國大將 
                   qwert-54321

2 个答案:

答案 0 :(得分:2)

ASCII字符串的格式都正确,而非ASCII字符串则不是。

原因是,字符串的长度按其字节数计算。例如,使用UTF-8编码,

print(string.len("美國大將"))  -- 12
print(string.len("루아"))      -- 6

因此%s中的string.format将这两个字符串视为宽度为12/6。

答案 1 :(得分:0)

function utf8format(fmt, ...)
   local args, strings, pos = {...}, {}, 0
   for spec in fmt:gmatch'%%.-([%a%%])' do
      pos = pos + 1
      local s = args[pos]
      if spec == 's' and type(s) == 'string' and s ~= '' then
         table.insert(strings, s)
         args[pos] = '\1'..('\2'):rep(#s:gsub("[\128-\191]", "")-1)
      end
   end
   return (fmt:format((table.unpack or unpack)(args))
      :gsub('\1\2*', function() return table.remove(strings, 1) end)
   )
end

local t =
{
   "character",
   "루아",           -- korean
   "abc감사합니다123", -- korean
   "ab23",
   "lua is funny",
   "ㅇㅅㅇ",
   "美國大將",         --chinese
   "qwert-54321",
   "∞"
};

for k, v in pairs(t) do
   print(utf8format("%30s", v));
end

但还有另一个问题:在大多数字体上,韩国和中国符号比拉丁字母更宽。