使用键查找值,反之亦然

时间:2012-01-10 19:26:55

标签: c# algorithm data-structures

首先,为令人讨厌的头衔道歉。我稍后会纠正。

我有一些数据如下,

"BOULEVARD","BOUL","BOULV", "BLVD"

我需要一个O(1)的数据结构,用于查找其他任何单词。例如,如果我使用字典,我需要存储这样的键/值,这对我来说很奇怪,

abbr.Add("BLVD", new List<string> { "BOULEVARD","BOUL","BOULV", "BLVD" });
abbr.Add("BOUL", new List<string> { "BOULEVARD", "BOUL", "BOULV", "BLVD" });
abbr.Add("BOULV", new List<string> { "BOULEVARD", "BOUL", "BOULV", "BLVD" });
abbr.Add("BOULEVARD", new List<string> { "BOULEVARD", "BOUL", "BOULV", "BLVD" });

使用哪种数据结构来保存此数据适合我的查询条款?

提前致谢

6 个答案:

答案 0 :(得分:1)

创建两个HashMap - 一个将单词映射到一个组号。另一个将组号映射到单词列表。这样可以节省一些内存。

Map<String, Integer> - Word to Group Number
Map<Integer, List<String>> - Group Number to a list of words

您需要两次O(1)次查询 - 首先获取群组编号,然后按其获取 - 获取单词列表。

答案 1 :(得分:1)

假设abbr是Dictionary<String, IEnumerable<String>>,您可以使用以下函数:

public static void IndexAbbreviations(IEnumerable<String> abbreviations) {
    for (var a in abbreviations)
        abbr.Add(a, abbreviations);
}

这将使用提供的缩写列表填充字典,以便在字典中查找任何缩写时。它比您提供的示例代码略好,因为我没有为每个值创建新对象。

documentation开始,“使用其键检索值非常快,接近于O(1),因为Dictionary(Of TKey,TValue)类被实现为哈希表。”

答案 2 :(得分:1)

字典的选择对我来说很好。如上所述,您应该使用相同的列表在字典中引用。代码可以是这样的:

var allAbrList = new List<List<string>>
                 {
                    new List<string> {"BOULEVARD", "BOUL", "BOULV", "BLVD"},
                    new List<string> {"STREET", "ST", "STR"},
                    // ...
                 };

var allAbrLookup = new Dictionary<string, List<string>>();
foreach (List<string> list in allAbrList)
{
    foreach (string abbr in list)
    {
        allAbrLookup.Add(abbr, list);
    }
}

最后一部分可以转换为LINQ以减少代码,但这样更容易理解。

答案 3 :(得分:1)

如果您没有为每个密钥创建一个新列表,那么只要数据量不是很大,Dictionary<string, List<string>>就会快速且合理地节省内存。您也可以通过重用字符串本身获得一些额外的好处,尽管优化器可能会为您解决这个问题。

var abbr = new Dictionary<string, List<string>>;

var values = new List<string> { "BOULEVARD","BOUL","BOULV", "BLVD" };

foreach(var aValue in values) abbr.add(value, values);

答案 4 :(得分:0)

我没有理由将字典的值部分定义为List<string>对象,但也许这是您的要求。这个答案假定您只想知道这个词本质上是否意味着“大道”。

我会选择一个值作为“官方”值并将所有其他值映射到它,如下所示:

        var abbr = new Dictionary<string, string>(StringComparer.CurrentCultureIgnoreCase);

        abbr.Add("BLVD", "BLVD"); // this line may be optional
        abbr.Add("BOUL", "BLVD");
        abbr.Add("BOULV", "BLVD");
        abbr.Add("BOULEVARD", "BLVD");

或者,您可以为字典的值部分定义枚举,如下所示:

    enum AddressLine1Suffix
    {
        Road,
        Street,
        Avenue,
        Boulevard,
    }


        var abbr = new Dictionary<string, AddressLine1Suffix>(StringComparer.CurrentCultureIgnoreCase);

        abbr.Add("BLVD", AddressLine1Suffix.Boulevard);
        abbr.Add("BOUL", AddressLine1Suffix.Boulevard);
        abbr.Add("BOULV", AddressLine1Suffix.Boulevard);
        abbr.Add("BOULEVARD", AddressLine1Suffix.Boulevard);

答案 5 :(得分:0)

正如Petar Minchev所说,您可以将列表拆分为一个组列表和一个指向该组的键列表。为了简化(使用中),您可以编写自己的IDictionary实现,并使用Add方法构建这些组。我试了一下它似乎工作。以下是实施的重要部分:

public class GroupedDictionary<T> : IDictionary<T,IList<T>>
{
    private Dictionary<T, int> _keys;
    private Dictionary<int, IList<T>> _valueGroups;

    public GroupedDictionary()
    {
        _keys = new Dictionary<T, int>();
        _valueGroups = new Dictionary<int, IList<T>>();
    }

    public void Add(KeyValuePair<T, IList<T>> item)
    {
        Add(item.Key, item.Value);
    }

    public void Add(T key, IList<T> value)
    {
        // look if some of the values already exist
        int existingGroupKey = -1;
        foreach (T v in value)
        {
            if (_keys.Keys.Contains(v))
            {
                existingGroupKey = _keys[v];
                break;
            }
        }
        if (existingGroupKey == -1)
        {
            // new group
            int newGroupKey = _valueGroups.Count;
            _valueGroups.Add(newGroupKey, new List<T>(value));
            _valueGroups[newGroupKey].Add(key);
            foreach (T v in value)
            {
                _keys.Add(v, newGroupKey);
            }
            _keys.Add(key, newGroupKey);
        }
        else
        {
            // existing group
            _valueGroups[existingGroupKey].Add(key);
            // add items that are new
            foreach (T v in value)
            {
                if(!_valueGroups[existingGroupKey].Contains(v))
                {
                    _valueGroups[existingGroupKey].Add(v);
                }
            }
            // add new keys
            _keys.Add(key, existingGroupKey);
            foreach (T v in value)
            {
                if (!_keys.Keys.Contains(v))
                {
                    _keys.Add(v, existingGroupKey);
                }
            }
        }
    }

    public IList<T> this[T key]
    {
        get { return _valueGroups[_keys[key]]; }
        set { throw new NotImplementedException(); }
    }
}

用法可能如下所示:

var groupedDictionary = new GroupedDictionary<string>();
groupedDictionary.Add("BLVD", new List<string> {"BOUL", "BOULV"}); // after that three keys exist and one list of three items
groupedDictionary.Add("BOULEVARD", new List<string> {"BLVD"}); // now there is a fourth key and the key is added to the existing list instance
var items = groupedDictionary["BOULV"]; // will give you the list with four items

确实实现整个界面需要做很多工作,但它会在完成后给你一个你不必担心的封装类。