计算唯一身份的复杂公式算得太多了

时间:2013-10-19 01:50:11

标签: database excel excel-formula pivot-table countif

我在计算唯一patients和/或MRN的数量时遇到问题。我将参考的一名患者与他们各自的ID交叉三次,以确保每位患者只有一个唯一的MRN,即使他们可能在Excel数据库中出现多次。我的问题是使用公式:

=SUM(IF(FREQUENCY(MATCH(E4:E317,E4:E317,0),MATCH(E4:E317,E4:E317,0))>0,1))

对于患者姓名,结果为94,我有信心是正确的,但是:

=SUM(IF(FREQUENCY(MATCH(F4:F317,F4:F317,0),MATCH(F4:F317,F4:F317,0))>0,1))
对于MRN患者,

导致95,但不匹配。这最初促使我说患者可能偶然有两个MRN。但是,当我多次交叉引用以确保一次输入一个条目时,情况并非如此。

为什么会发生这种情况?

2 个答案:

答案 0 :(得分:1)

数据透视表可以快速而简单地识别其组件应该是唯一对的2元组的位置,在少数情况下(其他解决方案在许多情况下可能效果更好):

SO19461466 example

可以在单个“通道”中检查的2元组的数量几乎是无限的,并且可以通过空行识别不匹配。在示例中,MRN 4.00与两个名称ad相关联,可以看到a也与MRN 1.00相关联。

或者,删除重复项和排序将获得大致相同的结果,尽管由一个或多个重复值证明,而不是空白。

答案 1 :(得分:0)

尝试在名称旁边插入一列。假设名称旁边的新列是F,请在F4中放置以下内容:

 COUNTIF($E$4:$E$317,E4)

然后将F4切割并粘贴到F5:F317

总和F

对MRM使用相同的方法。