标签: scala apache-spark cosine-similarity
我想找到一篇新闻文章和一条推文之间的相似度。我想查看使用余弦相似度的新闻文章推文的相对性得分。 新闻文章在文本文件中,tweet为rdd。新闻文章有三段文字,而推文只是一行文字。我是scala的新手,因此正在等待详细的代码。请帮我解决问题。谢谢...