我正在尝试使用此项目:
https://github.com/UKPLab/sentence-transformers
对于嵌入非英语句子,该语言不是人类语言,而是机器语言(x86)
但是问题是我找不到一个简单的示例,该示例显示了如何使用没有任何标签或句子相似度值的自定义数据集嵌入句子。
基本上,我有一个句子列表数组,没有为它们的句子或相似性值添加任何标签,并且我希望将它们嵌入向量中,从而以最佳的方式保留句子的语义,到目前为止使用gensim库使用了word2vec和doc2vec,所以我想尝试此方法以查看其是否更好?
(对使用方法的任何其他建议也表示赞赏)