背景如下:
这里使用的核心算法是lstm。 数据集来自文本数据,我需要从矩阵转换为原始数据。不仅是准确性问题。
我想使用清晰的数据集生成模型。毫无疑问,这里将使用train_test_split函数。
现在,我想预测新的数据集(不知道它是清楚的还是恶意的)。 我有两个选择来预测新数据集:
使用全部新数据集来生成没有拆分功能的test_x和test_y。 我想知道这样的解决方案是否可能。因为根本没有test_size和random_seed。
使用split函数将新数据集拆分为训练和测试x,y并查看结果。 我想知道新数据集是否全部都将被模型覆盖。因为拆分新数据集时,预测部分基于测试数据。因此,这意味着模型不会预测分割的训练数据。
我想知道哪种方法更好,可以实现我的雄心壮志。