随机“int不可订阅”行为

时间:2013-12-12 02:48:27

标签: python json exception dictionary casting

我正在阅读一个有效的JSON文件(嵌套5级深度),然后向其中添加一些数据,然后尝试将这些数据用于某些计算。

我以随机方式收到int is not subscriptable个错误。我无法绕过它。转换为str()无效,使用pprint打印并不会减轻它,在输入时转换为int()也无济于事。我拼命地没有选择......

主要功能

with open(rNgram_file, 'r', encoding='utf-8') as ngram_file:
    data = json.load(ngram_file)
    data = rank_items(data)
    data = probability_items(data)

rank_items(数据)

所有值都以5嵌套级别计算,并在树中向上添加。我将int()强制转换添加到输入中作为可能的解决方案,但这没有帮助。 获取x_grams['_rank']

时出现问题
for ngram, one_grams in data.items():
        ngram_rank = 0
        for one_gram, two_grams in one_grams.items():
            one_gram_rank = 0
           [..]
                for four_gram, values in four_grams.items():
                # 4gram = of, values = 34
                three_gram_rank += values
                four_grams['_rank'] = int(three_gram_rank)
                two_gram_rank += three_gram_rank
           [..]    
            two_grams['_rank'] = int(one_gram_rank)
            ngram_rank += one_gram_rank
        one_grams['_rank'] = int(ngram_rank)

probability_items(数据)

这是错误发生的地方。看似随意,它会抱怨int is not subscriptable正在打印或分配x_rankx_grams['rank],即使它们是使用type()进行评估的(如果有效的话,会说<class 'int'>) 我在下面用注释标记了最常见的行。 奇怪的是,第2行和第3行从未引发异常......

    for ngram, one_grams in data.items():
        ngram_rank = int(one_grams['_rank'])               # never gives an error
        print("NgramRank: ", str(ngram_rank))              # never gives an error
        if ngram != '_rank':
            for one_gram, two_grams in one_grams.items():
                pprint(type(two_grams['_rank']))             # common error point
                one_gram_rank = str(two_grams['_rank'])      # never reaches this
                if one_gram != '_rank':
                    for two_gram, three_grams in two_grams.items():
                        pprint(type(three_grams['_rank']))   # common error point
                        pprint(str(three_grams['_rank']))    # never reaches this
                        two_gram_rank = str(three_grams['_rank'])
                        [..]
                    one_gram_prob = int(one_gram_rank) / int(ngram_rank)
                    two_grams['_prob'] = one_gram_prob
            ngram_prob = int(ngram_rank) / int(ngram_rank)
            one_grams['_prob'] = ngram_prob

以randowm方式,上面的常见错误点会抛出异常。由于这些例外,从未达到以下行。但是,如果删除常见错误点,下面的行将成为错误点。 有时,它在内部循环中完全运行,在计算时打印<class 'int'>,并且一直运行,直到它在异常时停止。

我不知道发生了什么,我甚至不明白当我使用Type()进行评估时,这个错误会怎样发生

由于这是一个奇怪的问题,而且我显然犯了一个奇怪的错误,所以我把所有代码放在一个要点:https://gist.github.com/puredevotion/7922480

希望有人可以提供帮助!

TraceBack详细信息

['Traceback (most recent call last):\n', '  File "Ngram_ranking.py", line 121, in probability_items\n    pprint(type(four_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]

*** extract_tb:
[('Ngram_ranking.py', 121, 'probability_items', "pprint(type(four_grams['_rank']))")]

*** format_tb:
['  File "Ngram_ranking.py", line 121, in probability_items\n    pprint(type(four_grams[\'_rank\']))\n']

*** tb_lineno: 121
Exception in on line 121: pprint(type(four_grams['_rank'])): 'int' object is not subscriptable

第115行的TraceBack

['Traceback (most recent call last):\n', '  File "Ngram_ranking.py", line 115, in probability_items\n    pprint(type(three_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]

*** extract_tb:
[('Ngram_ranking.py', 115, 'probability_items', "pprint(type(three_grams['_rank']))")]

*** format_tb:
['  File "Ngram_ranking.py", line 115, in probability_items\n    pprint(type(three_grams[\'_rank\']))\n']

*** tb_lineno: 115
Exception in on line 115: pprint(type(three_grams['_rank'])): 'int' object is not subscriptable

在probability_items(数据)顶部的PPRINT(数据)

{'aesthetic': {'_rank': 290,
           'feeling': {'_rank': 10,
                       'the': {'_rank': 10,
                               'feeling': {'_rank': 10, 'of': 10}}},
           'perception': {'_rank': 280,
                          'and': {'_rank': 190,
                                  'the': {'_rank': 190,
                                          'design': 15,
                                          'environment': 5,
                                          'music': 100,
                                          'painting': 15,
                                          'work': 5,
                                          'works': 50}},
                          'of': {'_rank': 90,
                                 'the': {'_rank': 50,
                                         'work': 30,
                                         'world': 20},
                                 'their': {'_rank': 40, 'female': 40}}}}}

1 个答案:

答案 0 :(得分:4)

问题是你有一个多级嵌套字典,并且你为所有三个级别复制相同的代码,尽管嵌套有些不同。

我会把你词典中的一部分用到

{
'aesthetic': 
    {
    '_rank': 290,
    'feeling': 
        {
        '_rank': 10,
        'the': 
            {
            '_rank': 10,
            'feeling': 
                {
                '_rank': 10, 
                'of': 10
                }
            }
         },
    }
}

您的顶级字典是统一的,因为值(对于键aesthetic总是字典。但是较低级别的ints也有一些值。

因此当你这样做时

for ngram, one_grams in data.items():

您有ngram=aestheticsone_grams={the dictionary}

int(one_grams['_rank'])

将始终有效(因为值字典具有元素_rank。所以你永远不会在这里得到错误。

现在我们进入下一步

one_gram, two_grams in one_grams.items()

.items()词典运行one_grams会给出

(one_gram,two_grams) = [('_rank', 290), ('feeling', {'_rank': 10, 'the': {'_rank': 10, 'feeling': {'_rank': 10, 'of': 10}}})]

注意two_grams对于第一个条目是int,对于第二个条目是dict。由于您在执行

时迭代整个items()
two_grams['_rank']

您遇到错误(告诉您在预计int时您已点击dict。内循环也会出现同样的问题。

由于没有订购字典,items()可以按任何顺序返回。因此_rank可以是第一个元素或低于其他字典元素。在那种情况下,你会进入内部for循环并在那里遇到同样的问题。

您可以在迭代时忽略_rank个键

for one_gram,two_grams one_grams.items(): 
    if one_gram=='_rank': 
        continue  

在所有循环中。