我想从列表中获取唯一的语言代码,但事实证明它更难以实现,因为它与unicode和字符串混合:
set([u'RU', u'FR', u'EN', u'PT', u'AR, CS, DA, DE, FI, FR, HE, NO, PL, PT, SL, SV, TH, TR, ZH', u'DE', u'TR', u'IT', u'DE, FR', u'TH', u'JA'])
我如何在这里获得一组独特的语言代码?
答案 0 :(得分:2)
如果您的输入看起来与示例相同,则可以在创建设置之前拆分几个长的项目:
uniques = set(x for x in names.split(u', ') for names in input_list)