在Excel中连续连接1000多个单元格以识别重复项

时间:2018-01-05 00:39:59

标签: excel excel-formula

我需要比较大量数据。我有一个1124行和700列的矩阵,我需要以某种方式识别哪些行是相同的(不包括第一行是ID)。

我已经尝试了各种方法来识别重复项,但我似乎找不到一种方法来识别一系列单元格中的重复项,我希望将整行(不包括A列)与所有其他行进行比较。

我还试图连接所有数据(每列只有1或0)但我找不到任何方法来连接一个范围,然后我可以向下拖动所有900多行。

也许还有其他方法可以解决这个问题。非常感谢谷歌迄今为止未能成功的任何想法或建议。我会提到我已经找到了可以插入excel的商业工具来执行此操作,但是我们不允许在工作中下载这些工具,因此我甚至无法使用其中一种的试用。

提前感谢任何建议。

更新

我的第一个连接问题已经解决,但连接的原因是允许我识别重复但我被困在这里。我现在在一个单元格中有我的千字符,但重复单元格值的条件格式没有任何作用。我已经通过在新工作表中将一个单元格复制到10行来测试这个,所以我知道这些值是相同的,但仍然没有好处。我也尝试过了,但这也不起作用。有关如何识别重复项的任何建议?

以下是一个单元格数据的示例。我需要比较大约1000个相似的值来识别重复: 001000000000000111100000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001000001000010000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000010000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

4 个答案:

答案 0 :(得分:1)

解决方案很大程度上取决于您的Excel版本。在带有Office 365订阅的Excel 2016中,您可以使用新的TextJoin函数来连接单元格值。

const uk = new L.LatLngBounds([[49,-9.5],[62,2.3]]);
this.atMap.fitBounds(uk);

这样的长字符串不适合Countif(),因此您可能希望将数据分解为多个连接列而不是一个。

答案 1 :(得分:0)

选择数据网格(900多行x 1000+列)。

复制

打开记事本并粘贴

单个单元格将由记事本中的标签分隔。选择其中一个制表符并复制(Ctrl + C)

查找并替换(Ctrl + H)没有任何选项卡的字符,按Enter键。现在所有的制表符都消失了,你应该拥有的是0和1的串联字符串。

如果任何字符串以0开头,您可能希望保留该字符串。在每个字符串前面附加一个“'”字符(如果您需要帮助,我可以找到一些简单的方法)。

现在在记事本中选择全部并复制所有900多个字符串

转到Excel并将其粘贴到最后一个数据列旁边的新列中。

宾果!!

答案 2 :(得分:0)

好吧,我想我已整理好了,将列复制到记事本并删除了标签,然后将其粘贴回excel中解决了问题A.

为了进行比较,我按此列排序,然后添加了一个新列,如果行中的值与上一行相同,则将文本放入其中。这使我能够识别出大量重复的位置。

答案 3 :(得分:0)

对于问题的第二部分,假设您的数据存在于单元格A1到A950中 -

  1. 选择这些单元格并按升序排序

  2. 保留列表中的第一个单元格,然后通过最后一个单元格选择A2,然后..

  3. ..点击Conditional Formatting - > New Rule - > Use a formula to determine which cells to format

  4. 输入公式=A1=A2,并设置您选择的Format

  5. 点击OK,点击OK

  6. 这会导致一组重复项的每个第一个值都不突出显示,并且所有以下重复项都会突出显示。

    希望这有帮助!