Question

我试图根据报告中提到的症状对医疗报告进行分类。我正在做的步骤是

1）从每份医疗报告中提取症状。

2）创建一组从所有医疗报告中提取的所有症状，到目前为止的总学期是3700。

3）在这些出院摘要中创建一套诊断和提及的所有疾病，到目前为止的总学期为1500.

4）现在，我遍历所有医疗报告，为每个报告及其诊断创建一个热矢量。我有5000个文件。

对于症状，我得到5000 X 3700的矩阵其中每行代表一个文档，每列显示一个症状。如果文档中存在症状，则列的值为1，否则值为零则症状为

对于诊断，我得到5000 X 1500的矩阵

I am using a backward propagating neural network for training. The network has 3700 input neurons, 1 hidden layer and 1500 output neurons.

问题在于无论我训练多少（到目前为止，我已经尝试了25000个时期），我的结果非常糟糕，

对于160多个标签，输出具有最大概率值（1），而我期待5个标签。

我可能做错了什么，或者我该怎么做才能改善结果。

更新：我尝试用最少的数据（100个文档和85000个时期）测试网络。

可能导致问题的一个问题是，从每个文档中，最多提取15到20个术语，因此一个热矢量具有20个1和3680个。有人可以建议这可能是问题吗？

Answer 1

没有足够的细节了解您的问题和实施但一个很好的起点将帮助您了解您是否有更多的技术问题（错误，网络架构等...）或数据问题是创建您知道应该适合您的模型的合成数据（假冒某些疾病，每个有一系列症状）

如果模型没有给出所需的结果，则可能是技术问题。如果是这样，它更可能是一个数据问题：可能你的数据太嘈杂，或者底层模型更复杂，或者你没有足够的数据。

Answer 2

以下是您可以尝试的一些事项（尽管这些并不能保证提高性能）：