我正在尝试执行以下操作:
我不知道如何完成步骤3-4。
array_data = ['HL22','PG1234-332HL','1334-SF-21HL','HL43--222PG','HL222AW11144RH','HLSSDD','SSDD']
predefined_code = ['AW','SS']
理想情况下,此步骤的结果应类似于
result_data = [['HL'],['PG,HL'],['SF','HL'],['HL','PG'],['HL','RH'],
['HL','DD'],['DD']
result_data = [['HL'],['PG'],['SF'],['PG'],['RH'], ['DD'],['DD']
对于第3步,我尝试了以下代码
not_in_predefined = [item for item in array_data if item not in predefined_code]
但是这不会产生我正在寻找的结果,因为它会根据项目检查项目。不是部分字符串匹配。
答案 0 :(得分:0)
使用正则表达式非常简单。
Compile The local variable map may not have been initialized
应该给您字符串中的文本,然后您可以对此进行所需的处理。
您可能希望最终将列表转换为集合并使用re.findall(r'[A-Z].',item)
操作,而不是循环并删除difference
列表中定义的元素。