抓取网站时尝试对位置进行编码/解码

时间:2018-09-15 11:34:14

标签: python python-3.x web-scraping

我正在尝试抓取网站,并在url中获取了城市和附近地区的参数。这些参数以以下编码显示:

例如

城市-%E7%E9%F4%E4 例如-%E1%FA +%E2%EC%E9%ED

我试图寻找这种格式,但找不到答案。

任何可以帮助我对该类型进行解码/编码的工具的想法,甚至甚至是该编码名称的名称都将对您有所帮助。

注意:我使用python抓取

编辑和更多信息: 这似乎是因为位置在希伯来语中,并且URL库对其进行了解析以使其成为有效的URL。 尝试使用python复制我执行的操作:

>>> import urllib.parse
>>> diction = {"City": "חיפה"}
>>> urllib.parse.urlencode(diction)

输出为:

'City=%D7%97%D7%99%D7%A4%D7%94'

这似乎是朝着正确方向迈出的一步,但仍然与网站本身使用的编码不同。

0 个答案:

没有答案