Question

我有一个嵌入矩阵 - 这是一个相同大小的嵌入向量列表。每个嵌入对应一个句子。我有一个pandas数据框，其中每一行代表一个句子，我想在这个数据框中添加一个包含每个句子嵌入的新列。

我试过了：

df['sent_emb'] = pd.DataFrame(sentences)

得到了：

> ValueError: Wrong number of items passed 30, placement implies 1

（我的嵌入大小为30）。在不丢失阵列结构的情况下，我无法正确使用它。

由于

Answer 1

您已将pd.DataFrame分配给pd.Series，但无法正常工作。

也许尝试tris：

df['sent_emb'] = sentences

Answer 2

在这种情况下，您可以将句子传递为pandas series。以下是理解的最小例子：

df = pd.DataFrame({'aaa': ['a','b','c']})
ex = [[1,2,3],[2,3,4],4,5,6]
df['sentences'] = pd.Series(ex)
print(df)

    aaa sentences
0   a   [1, 2, 3]
1   b   [2, 3, 4]
2   c       4

将列表列表转换为数据框中的数组列

2 个答案: