将一个标记列表作为一行分配给数据帧

时间:2016-05-11 16:22:14

标签: python-3.x pandas dataframe

我正在尝试创建一个数据框,其中第一列是标记列表,可以添加其他信息列。但是,pandas不允许将标记列表添加为一列。 所以代码如下所示

  array1 = ['two', 'sample', 'statistical', 'inferences', 'includes']
  array2 = ['references', 'please', 'see', 'next', 'page', 'the','material', 'of', 'these']
  array3 = ['time', 'student', 'interest', 'and', 'lecturer', 'preference', 'other', 'topics']


 ## initialise list 
 list = []
list.append(array1)
list.append(array2)
list.append(array3)

## create dataFrame 
numberOfRows = len(list)
df = pd.DataFrame(index=np.arange(0, numberOfRows), columns = ('data',    'diversity'))

df.iloc[0] = list[0]   

错误消息为

ValueError: cannot copy sequence with size 6 to array axis with dimension 2

有关如何更好地实现创建数据框和更新列的任何见解将不胜感激。 谢谢

1 个答案:

答案 0 :(得分:0)

好的,所以回答相当简单,发布它是为了繁荣。 将列表添加为行时,我需要包含列名称和位置。 所以代码如下所示。

   df.data[0] = array1