我想预测使用神经网络的公司破产。数据集的组织如下: 在2001 - 2012年期间,研究数据属于160家公司(50家破产公司和110家非破产公司)。破产由二元变量描述(0 =健康,1 =破产)。例如,公司A在2001 - 2012年期间没有破产,但公司B在2003年破产,每年每家公司有大约150个功能/投入,因此应选择其中一些功能,然后选择公司的健康状况应该预测。
现在,我不知道如何进行分类,以便考虑公司内部(趋势)和公司之间的相似程度。准确地说,我想考虑公司内部和公司之间的特征变化趋势。 如果我的问题是时间序列分类,我应该使用什么样的神经网络?循环神经网络?如果是这样,应该如何在Matlab中组织数据集。
anchor
致以最诚挚的问候,
答案 0 :(得分:1)
使用神经网络可以做到这一点。鉴于它是一个时间序列,并且您有许多功能,您可以将其视为分类或回归问题。我不知道你的数据,我只是举例说明。
您可以输入输入图层中的所有数据,并为每个样本提供理想的输出(要分类的功能),以训练您的神经网络模型。样本:
Company ; Year ; Feature 1 ; Feature 2 Ideal Output
1 ; 2000 ; 1 ; 1 1
2 ; 2001 ; 1 ; 2 0
3 ; 2002 ; 2 ; 4 1
4 ; 2003 ; 5 ; 0 1
5 ; 2004 ; 4 ; 1 0
现在,将它用作时间序列,您可以使用预测窗口来使用它,对于smaple,您可以选择要预测的要素并在数据之间滑动窗口以估计系列的理想输出。
让我们知道你有这些值的时间序列
2.5 ; 2.6 ; 3.2 ; 4.6 ; 5.1 ; 5.2 ; 5.9 ; 6.4 ; 7.1 ; 8.3 ; 9.1
使用3点的预测窗口,您将得到如下设置:
Inputs Ideal Output
2.5 ; 2.6 ; 3.2 4.6
2.6 ; 3.2 ; 4.6 5.1
3.2 ; 4.6 ; 5.1 5.2
4.6 ; 5.1 ; 5.2 5.9
5.1 ; 5.2 ; 5.9 6.4
5.2 ; 5.9 ; 6.4 7.1
5.9 ; 6.4 ; 7.1 8.3
6.4 ; 7.1 ; 8.3 9.1
另一种方法是使用更多属性的幻灯片窗口,样本,Company
,Year
,Feature 1
等等。但是您将获得一个大型神经网络模型。这不是问题,但可以花费更多的计算时间来训练它。
另一个重点是,神经网络是一种数学模型,因此,Company
等定性属性(其中A
或B
的值必须转换为数字,对于样本:1
(适用于A
),2
(适用于B
)等。