应用错误收集

我正在尝试为农村（村庄）区域创建一种用于地址分类或类似地址分类的机器学习算法。我有一个历史数据，其中包括地址（独立变量），村庄名称（独立变量）PIN码（独立变量），客户手机号码和路线编号（独立变量）列表。路线号适用于送货车，这将帮助他们覆盖该地区的最大送货目的地。

挑战-

好东西-

并非所有自变量都可以同时为错误/空值。

现在，创建此算法的目的是根据“地址”，“村庄”，“ Pin码”和历史数据（其中我们已手动选择要发送的路线）来选择最佳路线号车）。

我是初学者，我很困惑如何执行该过程。

完成任务。

地址清除-已删除短词，已删除大字，已删除停用词。

现在尝试使用字向量，但我无法做到这一点。