卷积网络预测ICD9代码中的RxNorm代码是否有意义?

时间:2017-07-18 16:30:35

标签: scikit-learn neural-network deep-learning keras convolution

我被公司要求专门使用卷积神经网络来预测根据给出的诊断(ICD9代码)规定的药物类型(RxNorm代码)。我会得到医生写的一百万张处方。每个处方都独立于下一个处方。

所以一个例子是:110, 670, 890, BB2344 前3项是ICD9代码,最后一项是输出,RxNorm代码。其中有一百万。

老实说,这项任务对我来说似乎毫无意义。我对如何构建输入一无所知。

诊断没有固有的顺序,没有时间戳。

一种诊断可能使另一种诊断更有可能;但是有很多例子他们只是独立的。

ICD9编码系统具有分层结构,因此110和120(两种感染)的代码都比代码110和890更密切相关。(感染和伤口)。

基本上,我的输入“图像”应该是什么样的?或者CNN对这个问题根本没有意义吗?

谢谢!

1 个答案:

答案 0 :(得分:-1)

CNN要求输入中的空间(或时间)相关性。这里没有这样的东西,所以简短的答案是不,没有意义。一般来说,考虑到数据的简单性,我实际上期望一些基本的线性模型(在一个热编码数据上)/甚至基本规则导入都能很好地工作。

唯一可能使用" cnn-like"结构是通过图形CNN来利用图形性质。由于输入中的层次结构可以被认为是空间"的相关性。