我需要比较大量数据。我有一个1124行和700列的矩阵,我需要以某种方式识别哪些行是相同的(不包括第一行是ID)。
我已经尝试了各种方法来识别重复项,但我似乎找不到一种方法来识别一系列单元格中的重复项,我希望将整行(不包括A列)与所有其他行进行比较。
我还试图连接所有数据(每列只有1或0)但我找不到任何方法来连接一个范围,然后我可以向下拖动所有900多行。
也许还有其他方法可以解决这个问题。非常感谢谷歌迄今为止未能成功的任何想法或建议。我会提到我已经找到了可以插入excel的商业工具来执行此操作,但是我们不允许在工作中下载这些工具,因此我甚至无法使用其中一种的试用。
提前感谢任何建议。
更新
我的第一个连接问题已经解决,但连接的原因是允许我识别重复但我被困在这里。我现在在一个单元格中有我的千字符,但重复单元格值的条件格式没有任何作用。我已经通过在新工作表中将一个单元格复制到10行来测试这个,所以我知道这些值是相同的,但仍然没有好处。我也尝试过了,但这也不起作用。有关如何识别重复项的任何建议?
以下是一个单元格数据的示例。我需要比较大约1000个相似的值来识别重复: 001000000000000111100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000001000010000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
答案 0 :(得分:1)
解决方案很大程度上取决于您的Excel版本。在带有Office 365订阅的Excel 2016中,您可以使用新的TextJoin函数来连接单元格值。
const uk = new L.LatLngBounds([[49,-9.5],[62,2.3]]);
this.atMap.fitBounds(uk);
这样的长字符串不适合Countif(),因此您可能希望将数据分解为多个连接列而不是一个。
答案 1 :(得分:0)
选择数据网格(900多行x 1000+列)。
复制
打开记事本并粘贴
单个单元格将由记事本中的标签分隔。选择其中一个制表符并复制(Ctrl + C)
查找并替换(Ctrl + H)没有任何选项卡的字符,按Enter键。现在所有的制表符都消失了,你应该拥有的是0和1的串联字符串。
如果任何字符串以0开头,您可能希望保留该字符串。在每个字符串前面附加一个“'”字符(如果您需要帮助,我可以找到一些简单的方法)。
现在在记事本中选择全部并复制所有900多个字符串
转到Excel并将其粘贴到最后一个数据列旁边的新列中。
宾果!!
答案 2 :(得分:0)
为了进行比较,我按此列排序,然后添加了一个新列,如果行中的值与上一行相同,则将文本放入其中。这使我能够识别出大量重复的位置。
答案 3 :(得分:0)
对于问题的第二部分,假设您的数据存在于单元格A1到A950中 -
选择这些单元格并按升序排序
保留列表中的第一个单元格,然后通过最后一个单元格选择A2,然后..
..点击Conditional Formatting
- > New Rule
- > Use a formula to determine which cells to format
输入公式=A1=A2
,并设置您选择的Format
点击OK
,点击OK
这会导致一组重复项的每个第一个值都不突出显示,并且所有以下重复项都会突出显示。
希望这有帮助!