具有相同唯一病例ID的多种组合(ex drug-ADR)

时间:2014-10-01 11:52:32

标签: database r dataset data-mining

我对R统计数据很新,我可以帮助我。我试过通过搜索论坛等找到我的问题的答案,如果我的问题很简单或愚蠢,我会提前道歉。

我上个月收集了我的第一个数据集。我的数据集现在可以进行分析了。我花了一些时间学习R统计的最基本功能 我的数据集涉及药物不良反应报告。每份报告可能包含几种可疑药物和几种不良反应。因此,病例可含有几种药物和不良反应(药物-ADR)组合。有些情况只包含一种组合,其他情况则包含多种情

现在我的问题是:如何进行“特定于案例”的计算? 我想计算每种药物-ADR组合的已完成数据字段百分比的完整性分数,然后我想计算整个病例/报告的平均值。

我想计算每种药物-ADR组合的完整性评分(C),表示为: C =(1-Pi)=(1-P1)×(1-P2)×(1-P3)...... (1-Pn)的 ,其中Pi指的是扣除的罚金,如果数据字段不完整(前0.50表示50%)。如果信息没有丢失,那么最大分数将为1. n是参数/变量的数量。

最终,我想计算整个案例/报告的整体完整性得分。总分应根据每种药物-ADR组合的平均值计算。 C = Cj / m ,其中j表示当前的药物-ADR组合,m是药物-ADR的组合总数。

任何人都可以帮助我吗?

感谢你的关注!!我将非常感谢能得到的任何帮助。

0 个答案:

没有答案