我被公司要求专门使用卷积神经网络来预测根据给出的诊断(ICD9代码)规定的药物类型(RxNorm代码)。我会得到医生写的一百万张处方。每个处方都独立于下一个处方。
所以一个例子是:110, 670, 890, BB2344
前3项是ICD9代码,最后一项是输出,RxNorm代码。其中有一百万。
老实说,这项任务对我来说似乎毫无意义。我对如何构建输入一无所知。
诊断没有固有的顺序,没有时间戳。
一种诊断可能使另一种诊断更有可能;但是有很多例子他们只是独立的。
ICD9编码系统具有分层结构,因此110和120(两种感染)的代码都比代码110和890更密切相关。(感染和伤口)。
基本上,我的输入“图像”应该是什么样的?或者CNN对这个问题根本没有意义吗?
谢谢!
答案 0 :(得分:-1)
CNN要求输入中的空间(或时间)相关性。这里没有这样的东西,所以简短的答案是不,没有意义。一般来说,考虑到数据的简单性,我实际上期望一些基本的线性模型(在一个热编码数据上)/甚至基本规则导入都能很好地工作。
唯一可能使用" cnn-like"结构是通过图形CNN来利用图形性质。由于输入中的层次结构可以被认为是空间"的相关性。