所以我有一个看起来像这样的数据框:
split_df =
filename width height class xmin ymin xmax ymax
0 128778.JPG 5472 3648 Panel 4489 818 4915 1417
1 128778.JPG 5472 3648 Panel 3023 1278 3403 1854
2 128776.JPG 5472 3648 Panel 3369 1310 3759 1890
3 128776.JPG 5472 3648 Panel 3721 1339 4116 1919
4 128775.JPG 5472 3648 Panel 4076 1368 4476 1952
然后是两个列表,train_set和test_set,这是两个列表,如下所示:
train_set = ["128778.JPG", "128776.JPG"]
test_set = ["128775.JPG"]
所以基本上我想知道是否有一种方法可以根据这两个列表来拆分数据帧:
> train_df = split(split_df, train_set)
> train_df
> filename width height class xmin ymin xmax ymax
0 128778.JPG 5472 3648 Panel 4489 818 4915 1417
1 128778.JPG 5472 3648 Panel 3023 1278 3403 1854
2 128776.JPG 5472 3648 Panel 3369 1310 3759 1890
3 128776.JPG 5472 3648 Panel 3721 1339 4116 1919
> test_df = split(split_df, test_set)
> test_df
> filename width height class xmin ymin xmax ymax
0 128775.JPG 5472 3648 Panel 4076 1368 4476 1952