使用英文字母对使用母语编写的地址进行地理编码

时间:2018-03-20 08:04:53

标签: python r google-maps geocoding

我正在分析一些文字。我的要求是对用不同母语的英文字母写的地址进行地理编码。

Ex: chandpur market ke paas, village gorthaniya, UP, INDIA

在上面的句子中," ke paas" - >是一个HINDI词(印度民族语言),意思是" near"在英语和" chandapur市场"是名词(可以忽略转换)

现在我的挑战是将成千上万的单词转换为英语并识别街道名称和地理代码。不幸的是,我没有邮政编码或确切地址。

你能帮忙吗?

先谢谢!!

1 个答案:

答案 0 :(得分:4)

Google的geocode api支持印地语,因此您无需将其翻译为英语。以下是使用我的googleway包(在R中)指定language = "hi"参数的示例。

您需要一个API密钥才能通过googleway

使用Google API
library(googleway)

set_key("your_api_key")

res <- google_geocode(address = "village gorthaniya, UP, INDIA",
               language = "hi")

geocode_address(res)
# [1] "गोर्थानिया, उत्तर प्रदेश 272181, भारत"

geocode_coordinates(res)
#         lat      lng
# 1 26.85848 82.50099

geocode_address_components(res)
#   long_name short_name                                  types
# 1    गोर्थानिया      गोर्थानिया                    locality, political
# 2       बस्ती        बस्ती  administrative_area_level_2, political
# 3    उत्तर प्रदेश      उ॰ प्र॰  administrative_area_level_1, political
# 4       भारत         IN                      country, political
# 5    272181     272181                             postal_code