不区分大小写的字典

时间:2010-01-17 18:48:20

标签: python

我希望我的字典不区分大小写。

我有这个示例代码:

text = "practice changing the color"

words = {'color': 'colour',
        'practice': 'practise'}

def replace(words,text):

    keys = words.keys()

    for i in keys:
        text= text.replace(i ,words[i])
    return  text

text = replace(words,text)

print text

输出=练习改变颜色

我想要另一个字符串"practice changing the Color",(其中Color以大写字母开头)也可以提供相同的输出。

我相信有一种通用的方法可以转换为使用小写 mydictionary[key.lower()]但我不确定如何最好地将其整合到我现有的代码中。 (如果这是一个合理,简单的方法)。

10 个答案:

答案 0 :(得分:45)

optimistic locking不适用于很多的案例,因此无法用作插入式dict替代品。获得正确dict替换的一些棘手要点:

  • 重载所有涉及键的方法
  • 正确处理非字符串键
  • 正确处理类
  • 的构造函数

以下情况应该会好得多:

class CaseInsensitiveDict(dict):
    @classmethod
    def _k(cls, key):
        return key.lower() if isinstance(key, basestring) else key

    def __init__(self, *args, **kwargs):
        super(CaseInsensitiveDict, self).__init__(*args, **kwargs)
        self._convert_keys()
    def __getitem__(self, key):
        return super(CaseInsensitiveDict, self).__getitem__(self.__class__._k(key))
    def __setitem__(self, key, value):
        super(CaseInsensitiveDict, self).__setitem__(self.__class__._k(key), value)
    def __delitem__(self, key):
        return super(CaseInsensitiveDict, self).__delitem__(self.__class__._k(key))
    def __contains__(self, key):
        return super(CaseInsensitiveDict, self).__contains__(self.__class__._k(key))
    def has_key(self, key):
        return super(CaseInsensitiveDict, self).has_key(self.__class__._k(key))
    def pop(self, key, *args, **kwargs):
        return super(CaseInsensitiveDict, self).pop(self.__class__._k(key), *args, **kwargs)
    def get(self, key, *args, **kwargs):
        return super(CaseInsensitiveDict, self).get(self.__class__._k(key), *args, **kwargs)
    def setdefault(self, key, *args, **kwargs):
        return super(CaseInsensitiveDict, self).setdefault(self.__class__._k(key), *args, **kwargs)
    def update(self, E={}, **F):
        super(CaseInsensitiveDict, self).update(self.__class__(E))
        super(CaseInsensitiveDict, self).update(self.__class__(**F))
    def _convert_keys(self):
        for k in list(self.keys()):
            v = super(CaseInsensitiveDict, self).pop(k)
            self.__setitem__(k, v)

答案 1 :(得分:41)

仅供记录。我在Requests上找到了一个很棒的实现:

https://github.com/kennethreitz/requests/blob/v1.2.3/requests/structures.py#L37

答案 2 :(得分:39)

如果我理解正确并且您希望以非区分大小写的方式键入字典,那么一种方法是将dict子类化并重载setter / getter:

class CaseInsensitiveDict(dict):
    def __setitem__(self, key, value):
        super(CaseInsensitiveDict, self).__setitem__(key.lower(), value)

    def __getitem__(self, key):
        return super(CaseInsensitiveDict, self).__getitem__(key.lower())

答案 3 :(得分:9)

您是否考虑在输入中使用string.lower()并使用完全小写的字典?这是一个hacky解决方案,但它的工作原理

答案 4 :(得分:9)

在我的特定实例中,我需要一个不区分大小写的查找,但是,我不想修改密钥的原始大小写。例如:

>>> d = {}
>>> d['MyConfig'] = 'value'
>>> d['myconfig'] = 'new_value'
>>> d
{'MyConfig': 'new_value'}

您可以看到字典仍然具有原始密钥,但它可以不区分大小写访问。这是一个简单的解决方案:

class CaseInsensitiveKey(object):
    def __init__(self, key):
        self.key = key
    def __hash__(self):
        return hash(self.key.lower())
    def __eq__(self, other):
        return self.key.lower() == other.key.lower()
    def __str__(self):
        return self.key

在字典中获取和设置条目都需要__hash__和__eq__覆盖。这是创建键,如果它们不区分大小写,则会散列到字典中的相同位置。

现在要么创建一个自定义词典,使用提供的键初始化CaseInsensitiveKey:

class CaseInsensitiveDict(dict):
    def __setitem__(self, key, value):
        key = CaseInsensitiveKey(key)
        super(CaseInsensitiveDict, self).__setitem__(key, value)
    def __getitem__(self, key):
        key = CaseInsensitiveKey(key)
        return super(CaseInsensitiveDict, self).__getitem__(key)

或者只是确保在使用字典时始终将CaseInsensitiveKey的实例作为键传递。

答案 5 :(得分:2)

虽然不区分大小写的字典是一种解决方案,并且有如何实现这一点的答案,但在这种情况下可能更容易。不区分大小写的搜索就足够了:

import re

text = "Practice changing the Color"
words = {'color': 'colour', 'practice': 'practise'}

def replace(words,text):
        keys = words.keys()
        for i in keys:
                exp = re.compile(i, re.I)
                text = re.sub(exp, words[i], text)
        return text

text = replace(words,text)
print text

答案 6 :(得分:1)

我已经修改了simple yet good solution by pleasemorebacon(谢谢!),使其更加紧凑,自包含,并进行了较小的更新,以允许从{'a':1, 'B':2}进行构造并支持__contains__协议。 最后,由于CaseInsensitiveDict.Key应该是字符串(无论是否区分大小写),因此从Key派生str类是一个好主意,然后例如,可以将CaseInsensitiveDictjson.dumps一起转储。

# caseinsensitivedict.py
class CaseInsensitiveDict(dict):

    class Key(str):
        def __init__(self, key):
            str.__init__(key)
        def __hash__(self):
            return hash(self.lower())
        def __eq__(self, other):
            return self.lower() == other.lower()

    def __init__(self, data=None):
        super(CaseInsensitiveDict, self).__init__()
        if data is None:
            data = {}
        for key, val in data.items():
            self[key] = val
    def __contains__(self, key):
        key = self.Key(key)
        return super(CaseInsensitiveDict, self).__contains__(key)
    def __setitem__(self, key, value):
        key = self.Key(key)
        super(CaseInsensitiveDict, self).__setitem__(key, value)
    def __getitem__(self, key):
        key = self.Key(key)
        return super(CaseInsensitiveDict, self).__getitem__(key)

对于那些喜欢检查实际情况的人来说,这是一个基本的测试脚本:

# test_CaseInsensitiveDict.py
import json
import unittest
from caseinsensitivedict import *

class Key(unittest.TestCase):
    def setUp(self):
        self.Key = CaseInsensitiveDict.Key
        self.lower = self.Key('a')
        self.upper = self.Key('A')

    def test_eq(self):
        self.assertEqual(self.lower, self.upper)

    def test_hash(self):
        self.assertEqual(hash(self.lower), hash(self.upper))

    def test_str(self):
        self.assertEqual(str(self.lower), 'a')
        self.assertEqual(str(self.upper), 'A')

class Dict(unittest.TestCase):
    def setUp(self):
        self.Dict = CaseInsensitiveDict
        self.d1 = self.Dict()
        self.d2 = self.Dict()
        self.d1['a'] = 1
        self.d1['B'] = 2
        self.d2['A'] = 1
        self.d2['b'] = 2

    def test_contains(self):
        self.assertIn('B', self.d1)
        d = self.Dict({'a':1, 'B':2})
        self.assertIn('b', d)

    def test_init(self):
        d = self.Dict()
        self.assertFalse(d)
        d = self.Dict({'a':1, 'B':2})
        self.assertTrue(d)

    def test_items(self):
        self.assertDictEqual(self.d1, self.d2)
        self.assertEqual(
            [v for v in self.d1.items()],
            [v for v in self.d2.items()])

    def test_json_dumps(self):
        s = json.dumps(self.d1)
        self.assertIn('a', s)
        self.assertIn('B', s)

    def test_keys(self):
        self.assertEqual(self.d1.keys(), self.d2.keys())

    def test_values(self):
        self.assertEqual(
            [v for v in self.d1.values()],
            [v for v in self.d2.values()])

答案 7 :(得分:1)

您可以使用一个衬里进行dict键不区分大小写的搜索:

>>> input_dict = {'aBc':1, 'xyZ':2}
>>> search_string = 'ABC'
>>> next((value for key, value in input_dict.items() if key.lower()==search_string.lower()), None)
1
>>> search_string = 'EFG'
>>> next((value for key, value in input_dict.items() if key.lower()==search_string.lower()), None)
>>>

您可以将其放入函数中


def get_case_insensitive_key_value(input_dict, key):
    return next((value for dict_key, value in input_dict.items() if dict_key.lower() == key.lower()), None)


请注意,仅返回第一个匹配项。

答案 8 :(得分:0)

如果您只需要在代码中执行一次(因此,没有指向函数),那么解决问题的最直接方法是:

lowercase_dict = {key.lower():original_dict中(key,value)的值}

我在这里假设所讨论的dict并不是那么大-复制它可能不太好,但是如果它不大,就不会伤害任何东西。

相对于@Fred的答案(尽管它也有效)的优点是,当不存在键时,它会产生与dict相同的结果:KeyError。

答案 9 :(得分:-1)

我只是设置了一个函数来处理此问题:

def setLCdict(d, k, v):
    k = k.lower()
    d[k] = v
    return d

myDict = {}

所以不是

myDict['A'] = 1
myDict['B'] = 2

您可以:

myDict = setLCdict(myDict, 'A', 1)
myDict = setLCdict(myDict, 'B', 2)

然后可以在查找值之前将其小写,或编写一个函数来查找。

    def lookupLCdict(d, k):
        k = k.lower()
        return d[k]

    myVal = lookupLCdict(myDict, 'a')

如果您想在全球范围内进行此操作,可能不理想,但是如果您只是希望将其用于其中,则效果很好。