标签: tf-idf cosine-similarity plagiarism-detection
我的问题与使用余弦相似度,TF-IDF等方法检测两个文档之间的抄袭有关的方法。如果有人要将俄语中的文档翻译成与英语等效的文档,软件会检测到这种抄袭吗?我的理解是,只有数据库包含该文档中该特定数据库中单词的“袋”。