我正在尝试抓取网站,并在url中获取了城市和附近地区的参数。这些参数以以下编码显示:
例如城市-%E7%E9%F4%E4 例如-%E1%FA +%E2%EC%E9%ED
我试图寻找这种格式,但找不到答案。
任何可以帮助我对该类型进行解码/编码的工具的想法,甚至甚至是该编码名称的名称都将对您有所帮助。
注意:我使用python抓取
编辑和更多信息: 这似乎是因为位置在希伯来语中,并且URL库对其进行了解析以使其成为有效的URL。 尝试使用python复制我执行的操作:
>>> import urllib.parse
>>> diction = {"City": "חיפה"}
>>> urllib.parse.urlencode(diction)
输出为:
'City=%D7%97%D7%99%D7%A4%D7%94'
这似乎是朝着正确方向迈出的一步,但仍然与网站本身使用的编码不同。