回归还是分类?如何确定样本量?

时间:2014-05-13 14:42:36

标签: machine-learning classification regression sample-size

我有一组具有n个特征(数字)的实例。 我每隔X个时间步重新采样我的功能,因此每个实例在t1:tn都有一组功能。 连续响应变量(例如,范围50:100)仅每X * z次测量一次。 (例如每分钟采样,每30分钟只响应一次)功能可能会随着时间的推移而改变。响应也是如此。

现在,在任何时候,我想将新实例映射到响应范围。

如果我没有失去你:-) 您是将此视为回归还是多类别分类问题(具有离散化的响应范围)? 在任何一种情况下,是否有一个经验法则我需要多少个实例?如果实例不遵循相同的分布(例如,对同一组特征值的响应不同,我可以使用聚类来过滤/分析这个吗?)

0 个答案:

没有答案