我有两个文本,我将其转换为单词袋。一袋文字1的文字,一袋文字2的文字。
我正试图找到一种方法将这两个文档的单词拼在一起,以了解它们之间的差异。
我想的一种方法是让两个木槌相互叠放,看看它们在哪些词(词数)上相同,在哪些词上不同。
我能够启动一个简单的条形图 从这里的指南 http://www.sthda.com/english/wiki/text-mining-and-word-cloud-fundamentals-in-r-5-simple-steps-you-should-know (请参阅最后的情节)
但是我现在有两个不能直接比较的条形图。
例如,我正在考虑将单词放在同一块情节上。 要么作为两个直方图一个接一个,要么创建一些2d聚类,显示两个文档不同的单词区域以及它们的重叠区域。
您将建议使用哪个包装和程序来比较这两个单词? 谢谢 亚历克斯