如何在Spark Scala中找到两个大小不同的字符串之间的余弦相似度

时间:2018-10-06 18:08:18

标签: scala apache-spark cosine-similarity

我想找到一篇新闻文章和一条推文之间的相似度。我想查看使用余弦相似度的新闻文章推文的相对性得分。 新闻文章在文本文件中,tweet为rdd。新闻文章有三段文字,而推文只是一行文字。我是scala的新手,因此正在等待详细的代码。请帮我解决问题。谢谢...

0 个答案:

没有答案