我正在阅读一个有效的JSON文件(嵌套5级深度),然后向其中添加一些数据,然后尝试将这些数据用于某些计算。
我以随机方式收到int is not subscriptable
个错误。我无法绕过它。转换为str()
无效,使用pprint
打印并不会减轻它,在输入时转换为int()
也无济于事。我拼命地没有选择......
主要功能
with open(rNgram_file, 'r', encoding='utf-8') as ngram_file:
data = json.load(ngram_file)
data = rank_items(data)
data = probability_items(data)
rank_items(数据)
所有值都以5嵌套级别计算,并在树中向上添加。我将int()
强制转换添加到输入中作为可能的解决方案,但这没有帮助。 获取x_grams['_rank']
for ngram, one_grams in data.items():
ngram_rank = 0
for one_gram, two_grams in one_grams.items():
one_gram_rank = 0
[..]
for four_gram, values in four_grams.items():
# 4gram = of, values = 34
three_gram_rank += values
four_grams['_rank'] = int(three_gram_rank)
two_gram_rank += three_gram_rank
[..]
two_grams['_rank'] = int(one_gram_rank)
ngram_rank += one_gram_rank
one_grams['_rank'] = int(ngram_rank)
probability_items(数据)
这是错误发生的地方。看似随意,它会抱怨int is not subscriptable
正在打印或分配x_rank
或x_grams['rank]
,即使它们是使用type()
进行评估的(如果有效的话,会说<class 'int'>
)
我在下面用注释标记了最常见的行。
奇怪的是,第2行和第3行从未引发异常......
for ngram, one_grams in data.items():
ngram_rank = int(one_grams['_rank']) # never gives an error
print("NgramRank: ", str(ngram_rank)) # never gives an error
if ngram != '_rank':
for one_gram, two_grams in one_grams.items():
pprint(type(two_grams['_rank'])) # common error point
one_gram_rank = str(two_grams['_rank']) # never reaches this
if one_gram != '_rank':
for two_gram, three_grams in two_grams.items():
pprint(type(three_grams['_rank'])) # common error point
pprint(str(three_grams['_rank'])) # never reaches this
two_gram_rank = str(three_grams['_rank'])
[..]
one_gram_prob = int(one_gram_rank) / int(ngram_rank)
two_grams['_prob'] = one_gram_prob
ngram_prob = int(ngram_rank) / int(ngram_rank)
one_grams['_prob'] = ngram_prob
以randowm方式,上面的常见错误点会抛出异常。由于这些例外,从未达到以下行。但是,如果删除常见错误点,下面的行将成为错误点。
有时,它在内部循环中完全运行,在计算时打印<class 'int'>
,并且一直运行,直到它在异常时停止。
我不知道发生了什么,我甚至不明白当我使用Type()
进行评估时,这个错误会怎样发生
由于这是一个奇怪的问题,而且我显然犯了一个奇怪的错误,所以我把所有代码放在一个要点:https://gist.github.com/puredevotion/7922480
希望有人可以提供帮助!
TraceBack详细信息
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 121, 'probability_items', "pprint(type(four_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n']
*** tb_lineno: 121
Exception in on line 121: pprint(type(four_grams['_rank'])): 'int' object is not subscriptable
第115行的TraceBack
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 115, 'probability_items', "pprint(type(three_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n']
*** tb_lineno: 115
Exception in on line 115: pprint(type(three_grams['_rank'])): 'int' object is not subscriptable
在probability_items(数据)顶部的PPRINT(数据)
{'aesthetic': {'_rank': 290,
'feeling': {'_rank': 10,
'the': {'_rank': 10,
'feeling': {'_rank': 10, 'of': 10}}},
'perception': {'_rank': 280,
'and': {'_rank': 190,
'the': {'_rank': 190,
'design': 15,
'environment': 5,
'music': 100,
'painting': 15,
'work': 5,
'works': 50}},
'of': {'_rank': 90,
'the': {'_rank': 50,
'work': 30,
'world': 20},
'their': {'_rank': 40, 'female': 40}}}}}
答案 0 :(得分:4)
问题是你有一个多级嵌套字典,并且你为所有三个级别复制相同的代码,尽管嵌套有些不同。
我会把你词典中的一部分用到
{
'aesthetic':
{
'_rank': 290,
'feeling':
{
'_rank': 10,
'the':
{
'_rank': 10,
'feeling':
{
'_rank': 10,
'of': 10
}
}
},
}
}
您的顶级字典是统一的,因为值(对于键aesthetic
)总是字典。但是较低级别的ints
也有一些值。
因此当你这样做时
for ngram, one_grams in data.items():
您有ngram=aesthetics
和one_grams={the dictionary}
int(one_grams['_rank'])
将始终有效(因为值字典具有元素_rank
。所以你永远不会在这里得到错误。
现在我们进入下一步
one_gram, two_grams in one_grams.items()
为.items()
词典运行one_grams
会给出
(one_gram,two_grams) = [('_rank', 290), ('feeling', {'_rank': 10, 'the': {'_rank': 10, 'feeling': {'_rank': 10, 'of': 10}}})]
注意two_grams
对于第一个条目是int
,对于第二个条目是dict
。由于您在执行
two_grams['_rank']
您遇到错误(告诉您在预计int
时您已点击dict
。内循环也会出现同样的问题。
由于没有订购字典,items()可以按任何顺序返回。因此_rank
可以是第一个元素或低于其他字典元素。在那种情况下,你会进入内部for循环并在那里遇到同样的问题。
您可以在迭代时忽略_rank
个键
for one_gram,two_grams one_grams.items():
if one_gram=='_rank':
continue
在所有循环中。