标签: machine-learning
我正在研究纽约出租车数据集。数据需要进行一些清理,因为某些值(例如旅行总金额= $ 1000)显然是不可能的。为了进行数据清理,我们需要使用一些基于常识的启发式方法。我想使用不需要领域专业知识的算法来执行数据清理。