我是ML和Kaggle的新手。我正在研究Kaggle挑战的解决方案。
挑战:https://www.kaggle.com/c/trackml-particle-identification
解决方案:https://www.kaggle.com/outrunner/trackml-2-solution-example
在遍历代码时,我注意到作者仅使用了train_1文件(未使用train_2、3,...)。
我知道仅使用train_1文件会涉及一些策略。有人可以解释为什么吗?另外,blacklist_training.zip,train_sample.zip和detectors.zip文件有什么用途?
答案 0 :(得分:2)
我是挑战赛的组织者之一。 train_1 2 3 ..文件都是等效的。 Outrunner可能已经看到使用更多数据没有任何改善。
train_sample.zip 是一个小数据集,等效于train_1 2 3 ...,为方便起见而提供。
blacklist_training.zip 是由于模拟器中的一个小错误(不是很重要)而要忽略的粒子列表。
detectors.zip 是进行x y z测量的几何表面的列表。
大卫