我正在努力将包含Unicode,长整数和整数的列表列表转换为数据框。数据示例如下
listOfList = [[u'462', u'40340',u'40340',u'Rochester, MN',u'Rochester, MN Metro Area',u'M1',u'1',u'G3110',6415503905,75224362,u'+43.9496362',u'-092.3360701'], [u'450',u'39580',u'39580',u'Raleigh, NC',u'Raleigh, NC Metro Area',u'M1',u'1',u'G3110',5485217808L,76814164,u'+35.7567464',u'-078.4604412']]
在父listOfList对象的每个子列表中,元素8和9分别总是长和整数。但是,我无法弄清楚如何对列表列表进行切片以排除子列表中的元素8和9,以便可以将Unicode编码为utf-8。如果我可以对unicode元素进行编码,则要获得类似于以下示例cleanlistOfList的结果,将其加载到数据帧将非常容易。
cleanlistOfList = [['462', '40340','40340','Rochester, MN','Rochester, MN Metro Area','M1','1','G3110',6415503905,75224362,'+43.9496362','-092.3360701'],['450','39580','39580','Raleigh, NC','Raleigh, NC Metro Area','M1','1','G3110',5485217808L,76814164,'+35.7567464','-078.4604412']]
df = pd.DataFrame(cleanlistOfList)
有人知道如何将listOfList编码为干净的表单,或者将不干净的listOfList加载到DataFrame吗?
答案 0 :(得分:0)
如果您要从所有子列表中“删除”元素8和9。您可以这样做:
NewList = [child[:8] + child[10:] for child in listOfList]
这将创建一个新列表,而不更改原始的listOfList。