Question

我有物品清单：

['MRS_103_005_010_BG_001_v001',
'MRS_103_005_010_BG_001_v002',
'MRS_103_005_010_FG_001_v001',
'MRS_103_005_010_FG_001_v002',
'MRS_103_005_010_FG_001_v003',
'MRS_103_005_020_BG_001_v001',
'MRS_103_005_020_BG_001_v002',
'MRS_103_005_020_BG_001_v003']

我需要确定每个项目的最新版本并将其存储到新列表中。我的逻辑有问题。

基于它的构建方式，我相信我需要首先将索引进行相互比较。如果找到匹配项，然后检查哪个数字更大。

我认为我首先需要检查文件夹名称在当前索引和下一个索引之间是否匹配。我通过制作两个变量（0和1）来表示索引来做到这一点，因此我可以对其列表进行交错的增量比较。如果两个索引匹配，则需要最后检查vXXX编号。最高者将被添加到新列表中。

我怀疑问题出在列表的一个副本比另一个副本先到达一个空索引，但是我不确定如何弥补这一点。

再次，我不是行业程序员。任何帮助，将不胜感激！谢谢。

# Preparing variables for filtering the folders
versions = foundVerList
verAmountTotal = len(foundVerList) 
verIndex = 0
verNextIndex = 1
highestVerCount = 1
filteredVersions = []


# Filtering, this will find the latest version of each folder and store to a list

while verIndex < verAmountTotal:
    try:
        nextVer = (versions[verIndex]) 
        nextVerCompare = (versions[verNextIndex])
    except IndexError:
        verNextIndex -= 1

    if nextVer[0:24] == nextVerCompare[0:24]:
        if nextVer[-3:] < nextVerCompare [-3:]:
            filteredVersions.append(nextVerCompare)
        else:
            filteredVersions.append(nextVer)  



    verIndex += 1
    verNextIndex += 1

我的预期输出是：

print filteredVersions
['MRS_103_005_010_BG_001_v002', 'MRS_103_005_010_FG_001_v003']
['MRS_103_005_020_BG_001_v003']

实际输出为：

print filteredVersions
['MRS_103_005_010_BG_001_v002', 'MRS_103_005_010_FG_001_v002', 
'MRS_103_005_010_FG_001_v003']

['MRS_103_005_020_BG_001_v002', 'MRS_103_005_020_BG_001_v003']

在with循环期间，我在通过verIndex引用的每个文件夹上使用os.list。我相信问题在于正在为每个搜索到的文件夹生成一个列表，但我希望将所有搜索合并到一个列表中，然后再进行groupby和排序操作。

Answer 1

似乎是itertools.groupby的情况：

from itertools import groupby

grouped = groupby(data, key=lambda version: version.rsplit('_', 1)[0])
result = [sorted(group, reverse=True)[0] for key, group in grouped]

print(result)

输出：

['MRS_103_005_010_BG_001_v002',
 'MRS_103_005_010_FG_001_v003',
 'MRS_103_005_020_BG_001_v003']

这会将条目按最后一个下划线之前的所有内容分组，我认为这是“商品代码”。

然后，它以相反的顺序对每个组进行排序。每个组的元素仅在版本上有所不同，因此具有最高版本号的条目将是第一个。

最后，它从每个组中提取第一个条目，并将其放回到结果list中。

Answer 2

尝试一下：

text = """MRS_103_005_010_BG_001_v001
MRS_103_005_010_BG_001_v002
MRS_103_005_010_FG_001_v001
MRS_103_005_010_FG_001_v002
MRS_103_005_010_FG_001_v003
MRS_103_005_020_BG_001_v001
MRS_103_005_020_BG_001_v002
MRS_103_005_020_BG_001_v003
"""

result = {}

versions = text.splitlines()

for item in versions:
    v = item.split('_')
    num = int(v.pop()[1:])
    name = item[:-3]


    if result.get(name, 0) < num:
        result[name] = num 

filteredVersions = [k + str(v) for k, v in result.items()]

print(filteredVersions)

输出：

['MRS_103_005_010_BG_001_v2', 'MRS_103_005_010_FG_001_v3', 'MRS_103_005_020_BG_001_v3']

将列表的元素与其自身进行比较

2 个答案: