我有一个嵌入矩阵 - 这是一个相同大小的嵌入向量列表。 每个嵌入对应一个句子。 我有一个pandas数据框,其中每一行代表一个句子,我想在这个数据框中添加一个包含每个句子嵌入的新列。
我试过了:
df['sent_emb'] = pd.DataFrame(sentences)
得到了:
> ValueError: Wrong number of items passed 30, placement implies 1
(我的嵌入大小为30)。 在不丢失阵列结构的情况下,我无法正确使用它。
由于
答案 0 :(得分:0)
您已将pd.DataFrame
分配给pd.Series
,但无法正常工作。
也许尝试tris:
df['sent_emb'] = sentences
答案 1 :(得分:0)
在这种情况下,您可以将句子传递为pandas series
。以下是理解的最小例子:
df = pd.DataFrame({'aaa': ['a','b','c']})
ex = [[1,2,3],[2,3,4],4,5,6]
df['sentences'] = pd.Series(ex)
print(df)
aaa sentences
0 a [1, 2, 3]
1 b [2, 3, 4]
2 c 4