dictionary[pattern_key] = {"key": index_key, "document": index_source, "startPos":index_start, "endPos": index_end}
这是我的词典列表的摘录
{
'AGACAATCTC': {'startPos': '174', 'document': 'source-document01012.txt', 'endPos': '183', 'key': 'AGACAATCTC'},
'GGTCAGACAA': {'startPos': '18', 'document': 'source-document01012.txt', 'endPos': '27', 'key': 'GGTCAGACAA'},
'TAGATGAAGT': {'startPos': '102', 'document': 'source-document01012.txt', 'endPos': '111', 'key': 'TAGATGAAGT'}
}
我如何通过文档然后通过 startPos 对其进行排序?
我尝试过类似的东西,但不起作用
sorted_dict = sorted(dictionary, key=itemgetter(pattern_key[document]))
script.py
#!/usr/bin/env python
import sys
dictionary = {};
for pattern in sys.stdin:
if "," in pattern:
pattern_key, pattern_source, pattern_start, pattern_end = pattern.strip().split(",")
index_file = open('index.txt', 'r')
for line in index_file:
if "," in line:
index_key, index_source, index_start, index_end = line.strip().split(",")
if pattern_key == index_key:
dictionary[pattern_key] = {"document": index_source, "startPos":index_start, "endPos": index_end}
sorted(dictionary.items(), key = lambda x: (x[1]['document'], int(x[1]['startPos'])))
for k, v in dictionary.items():
print (k, '-->', v)
答案 0 :(得分:3)
您可以将内部词典中的条目作为sorted
的键:
sorted(dictionary.items(), key = lambda x: (x[1]['document'], int(x[1]['startPos'])))
元组键首先按第0个元素排序,然后按第1个元素排序,依此类推。
请注意,这会生成一个元组列表,其中每个元组都是(str, dict)
。
编辑:
在您的上下文中,正确的实现如下:
sorted_values = sorted(dictionary.items(), key = lambda x: (x[1]['document'], int(x[1]['startPos'])))
for k, v in sorted_values:
print (k, '-->', v)
答案 1 :(得分:2)
根据您所需的条件进行排序,然后从排序列表中创建一个新的OrderedDict
,因为dict
无法按照其性质进行排序:
>>> from collections import OrderedDict
>>>
>>> d = {'AGACAATCTC': {'endPos': '183', 'document': 'source-document01010.txt', 'key': 'AGACAATCTC', 'startPos': '174'}, 'GGTCAGACAA': {'endPos': '27', 'document': 'source-document01010.txt', 'key': 'GGTCAGACAA', 'startPos': '18'}, 'TAGATGAAGT': {'endPos': '111', 'document': 'source-document01011.txt', 'key': 'TAGATGAAGT', 'startPos': '102'}}
>>>
>>> d_ordered = OrderedDict(sorted(d.items(), key=lambda t:(t[1]['document'], int(t[1]['startPos']))))
>>>
>>> d_ordered
OrderedDict([('GGTCAGACAA', {'endPos': '27', 'document': 'source-document01010.txt', 'key': 'GGTCAGACAA', 'startPos': '18'}), ('AGACAATCTC', {'endPos': '183', 'document': 'source-document01010.txt', 'key': 'AGACAATCTC', 'startPos': '174'}), ('TAGATGAAGT', {'endPos': '111', 'document': 'source-document01011.txt', 'key': 'TAGATGAAGT', 'startPos': '102'})])