lua - 检查字符串中的重复数据

时间:2013-10-01 15:57:39

标签: lua duplicates lua-table

我收到以下字符串数据作为输入:

"route1,1234,1,no~,,route2,1234,1,no~,"

它代表数据的两个“记录”......其中每个记录有4个字段。 我已经构建了代码来将这个字符串解析为它的各个列/字段。 但是那个不起作用的部分是当我测试我是否在字段2中有任何重复时。字段2是当前具有“1234”作为值的那个。

以下是代码:

function string:split(delimiter)
  local result = { }
  local from = 1
  local delim_from, delim_to = string.find( self, delimiter, from )
  while delim_from do
    table.insert( result, string.sub( self, from , delim_from-1 ) )
    from = delim_to + 1
    delim_from, delim_to = string.find( self, delimiter, from )
  end
  table.insert( result, string.sub( self, from ) )
  return result
end

local check_for_duplicate_entries = function(route_data)
      local route
      local route_detail = {}  
      local result =true 
      local errtxt 
      local duplicate = false 

print("received :" ..route_data)
      route = string.gsub(route_data, "~,,", "~") 
      route = route:sub(1,string.len(route)-2)
print("route :" ..route)

      -- break up in to an array
      route = string.split(route,"~")

      for key, value in pairs(route) do
            route_detail[key] = string.split(value,",")
      end 

      local list_of_second_column_only = {}
      for key,value in pairs(route_detail) do
         local temp = value[2]
         print(temp .. " - is the value I'm checking for")
         if list_of_second_column_only[temp] == nil then
            print("i dont think it exists")
            list_of_second_column_only[key] = value[2]
            print(list_of_second_column_only[key])
         else
            --found a duplicate. 
            return true
         end
      end
      return false
end

print(check_for_duplicate_entries("route1,1234,1,no~,,route2,1234,1,no~,"))

我认为我出错的地方是测试:

 if list_of_second_column_only[temp] == nil then

我认为我正在使用值temp检查键,而不是使用temp包含的值检查值。但我不知道如何修复语法。 另外,我想知道是否有更有效的方法来做到这一点。 我作为输入接收的“记录”的数量是动态/未知的,每个记录中第二列的值也是如此。

感谢。

编辑1

我尝试用作参考的帖子是:Search for an item in a Lua list

在答案中,他们展示了如何按值测试表中的记录,而不是遍历整个表...

if items["orange"] then
  -- do something
end

我正在四处尝试做类似的事情......

2 个答案:

答案 0 :(得分:1)

只有一个表创建和较少的正则表达式匹配,这应该更高效。

match确实要求您只对第二个字段中的dup感兴趣。

local function check_for_duplicate_entries(route_data)
    assert(type(route_data)=="string")
    local field_set = {}
    for route in route_data:gmatch"([^~]*)~,?,?" do
        local field = route:match",([^,]*)"
        if field_set[field] then
            return true
        else
            field_set[field] = true
        end
    end 
    return false
end

答案 1 :(得分:0)

试试这个。它正在检查第二个字段的值。

我没有看过效率。

if list_of_second_column_only[value[2]] == nil then
    print("i dont think it exists")
    list_of_second_column_only[value[2]] = true
    print(list_of_second_column_only[value[2]])
else
    --found a duplicate.
    return true
end