如何基于python和NLPK中CSV文件中的训练数据预测位置

时间:2018-10-23 11:40:33

标签: python pandas machine-learning nlp stanford-nlp

我想预测一个基于位置的训练数据。我的数据格式如下。

培训数据:

Address Location_id Location_name
Flat No.201, MIDC, Andheri East, Mumbai, Maharashtra    121 Andheri East
Business Park, Goregaon, Mumbai, Maharashtra    122 Goregaon
Powai, Mumbai   123 Powai
Andheri East, Mumbai    121 Andheri East
Best Business Park, Goregaon, Mumbai    122 Goregaon
Hiranandani Park, Powai, Mumbai 123 Powai

测试数据:

plot no. 121, MIDC Area, Andheri East, Mumbai

预期输出:

To predict the location ID and Location Name.

请提出建议。

2 个答案:

答案 0 :(得分:1)

我认为NLPK在这里不合适,因为您不是在分析具有自然语言的文本中的普通单词或句子,而只是分析一些专有名词。

我不知道您试用的目的是什么,但是您必须知道,机器学习并不是针对此类问题而使用的数据量很少。

如果您只是想根据地址确定城市,我认为您最好使用Google Maps API或类似的方法。

答案 1 :(得分:0)

您要执行的操作需要简单的逻辑。 您需要从给定的地址中提取区域名称。如果仅用“,”分隔地址并返回倒数第二个元素,则您的任务已完成。

session.save_path = C:\PHPSessions
error_log = "C:\PHPSessions\php-7.2.10_errors.log"