Question

我正在努力将包含Unicode，长整数和整数的列表列表转换为数据框。数据示例如下

listOfList = [[u'462', u'40340',u'40340',u'Rochester, MN',u'Rochester, MN Metro Area',u'M1',u'1',u'G3110',6415503905,75224362,u'+43.9496362',u'-092.3360701'], [u'450',u'39580',u'39580',u'Raleigh, NC',u'Raleigh, NC Metro Area',u'M1',u'1',u'G3110',5485217808L,76814164,u'+35.7567464',u'-078.4604412']]

在父listOfList对象的每个子列表中，元素8和9分别总是长和整数。但是，我无法弄清楚如何对列表列表进行切片以排除子列表中的元素8和9，以便可以将Unicode编码为utf-8。如果我可以对unicode元素进行编码，则要获得类似于以下示例cleanlistOfList的结果，将其加载到数据帧将非常容易。

cleanlistOfList = [['462', '40340','40340','Rochester, MN','Rochester, MN Metro Area','M1','1','G3110',6415503905,75224362,'+43.9496362','-092.3360701'],['450','39580','39580','Raleigh, NC','Raleigh, NC Metro Area','M1','1','G3110',5485217808L,76814164,'+35.7567464','-078.4604412']]

df = pd.DataFrame(cleanlistOfList)

有人知道如何将listOfList编码为干净的表单，或者将不干净的listOfList加载到DataFrame吗？

Answer 1

如果您要从所有子列表中“删除”元素8和9。您可以这样做：

NewList = [child[:8] + child[10:] for child in listOfList]

这将创建一个新列表，而不更改原始的listOfList。

将包含Unicode，长整数和整数的列表转换为数据框

1 个答案: