应用错误收集

有没有办法在SpaCy上使用nlp.pipe（）和pandas获得相似性分数？

时间：2019-05-29 10:17:00

标签： python pandas spacy

我想在熊猫列中的标记化文本上使用.similarity。

所以

我正在尝试使用此

df['tokenized'] = df['text'].apply(nlp)

然后

print(df.loc[0, 'tokenized'].similarity(df.loc[1, 'tokenized'])

获得相似性。它可以工作，但是当我有1万行的文档时，速度非常慢。

然后我尝试使用nlp.pipe

df['tokenized'] = nlp.tokenizer.pipe(df['text'])

速度更快，但是我得到了一列生成器而不是令牌。

是否可以使用nlp.pipe（）和熊猫获得相似度分数？

0 个答案:

没有答案