应用错误收集

背景如下：

这里使用的核心算法是lstm。数据集来自文本数据，我需要从矩阵转换为原始数据。不仅是准确性问题。

我想使用清晰的数据集生成模型。毫无疑问，这里将使用train_test_split函数。

现在，我想预测新的数据集（不知道它是清楚的还是恶意的）。我有两个选择来预测新数据集：

使用全部新数据集来生成没有拆分功能的test_x和test_y。我想知道这样的解决方案是否可能。因为根本没有test_size和random_seed。
使用split函数将新数据集拆分为训练和测试x，y并查看结果。我想知道新数据集是否全部都将被模型覆盖。因为拆分新数据集时，预测部分基于测试数据。因此，这意味着模型不会预测分割的训练数据。

我想知道哪种方法更好，可以实现我的雄心壮志。