标签: data-mining
假设我们有一个匿名数据的大型数据集。数据集由若干个变量和观察组成。我们所有可以了解的数据都是变量的类型(数字,字符,日期等)。我们可以通过手动查看数据来实现。 为了进一步分析,预处理数据集的最佳实践步骤是什么?
例如,让这个数据集只是一个表,所以我们不需要检查表之间的任何关系。
答案 0 :(得分:0)
This link提供了目前正在实施的完整验证集。不过,首先要说:
希望这足以让你开始......