我正在与Google的Machine Learning Crash Course一起学习,对代码有疑问。
基本上,在某些情况下,它们会将Prediction输出更改为numpy数组,但每次都会更改索引。我有点困惑。
示例1:
在train_linear_regressor_model中:
training_predictions = np.array([item['predictions'][0] for item in training_predictions])
validation_predictions = np.array([item['predictions'][0] for item in validation_predictions])
示例2:
在train_linear_classifier_model中:
training_probabilities = np.array([item['probabilities'] for item in training_probabilities])
validation_probabilities = np.array([item['probabilities'] for item in validation_probabilities])
示例3:
在建立ROC曲线时:
validation_probabilities = np.array([item['probabilities'][1] for item in validation_probabilities])
因此,在3种情况下,来自模型的Predictions变为numpy数组,但是每次附加其索引的位置都不相同。 为什么?
当我在示例3中更改索引时,我试图查看是否存在差异,因为ROC曲线依赖于该索引,这样我可以直接查看如果将索引从[1]更改为[0]或根本不给出索引。