因此,我正在使用ML.Net的VectorType属性。我正在使用的输入数据集是经过计算的,并且超级宽。我们正在讨论10000列(仍然在弄乱它以了解有意义的内容,并进行时间序列处理)。看来我可以将所有这些列都塞进一个巨大的数组中,然后将[VectorType]拍打成一天,或者……可以吗?
我的问题是,在Microsoft ML.Net眼中,以下示例之间有什么区别(如果有)?像这样,以向量的某种组合来排列列根本没有任何区别,还是纯粹为了易于阅读?
public class InputData
{
[LoadColumn(0), ColumnName("Label")]
public bool Label { get; set;}
[LoadColumn(1, 10000), ColumnName("Features")]
[VectorType(10000)]
public float[] SomeValues { get; set;}
}
和
public class InputData
{
[LoadColumn(0), ColumnName("Label")]
public bool Label { get; set;}
[LoadColumn(1, 5000), ColumnName("Features1")]
[VectorType(5000)]
public float[] SomeValues1 { get; set;}
[LoadColumn(5000, 10000), ColumnName("Features2")]
[VectorType(5000)]
public float[] SomeValues2 { get; set;}
}
如果有问题,我会将这些东西塞进AutoML API中,并使其加热8个小时。