我的DF分为测试和培训尺寸:
testSampleSize = 2573.0
trainingSampleSize = 7719.0
我使用:
计算测试样本的行数rows = random.sample(df.index, int(testSampleSize))
其中df是我的数据框。
为了获得我使用的测试数据:
df_test = bothDF.ix[rows]
但是这个df_test的长度为2604,而不是testSampleSize。
现在我从训练数据的初始DF中删除这些行:
df_training = bothDF.drop(rows)
此df_training的长度为7698。
为什么长度与创建的样本量不同?