训练和测试拆分标记

时间:2021-06-10 02:20:39

标签: python pandas machine-learning scikit-learn split

这是我的数据集:

import pandas as pd 
fileName= 'user.csv'
df = pd.read_csv("trainingsample_100k_apps.csv",sep=",",header=0)
pd.set_option('max_columns', None)
df

UserID  Total Usage
001       20.3
002       40.5
003       10.1

应用此查询后,如何知道选择了哪一行作为训练和测试:

train, test = train_test_split(df, test_size = 0.20)

我希望输出是这样的:

UserID  Total Usage   SplitingCategory
001       20.3        Training
002       40.5        Testing
003       10.1        Training

1 个答案:

答案 0 :(得分:0)

好的,我知道答案了

test

它会出现我的测试数据集