我用python编写了一个脚本来获取网站的内容(以表格格式)。当我执行脚本时,它会成功解析该内容。我唯一不能修改的是language选项。
该网站的内容使用Arabic
语言。但是,我的目的是以一种这样的方式进行解析,以使我得到的输出是英语。这就是我卡住的地方。我根据this answer尝试了headers={"Accept-Language":"en-US,en;q=0.9"}
,但在这种情况下似乎不起作用。如何更改语言选项以达到目的?
这是我的脚本:
import requests
from bs4 import BeautifulSoup
URL = "http://www.awm.gov.jo/dotnet/default.aspx"
req = requests.get(URL,headers={"Accept-Language":"en-US,en;q=0.9"})
soup = BeautifulSoup(req.text,"lxml")
for items in soup.select("#GV_prices tr"):
data = [item.get_text(strip=True) for item in items.select("th,td")]
print(data)
仅供参考,这是我第一次尝试headers={"Accept-Language": "en-US,en;q=0.5"}
,但也没有用。
答案 0 :(得分:0)
您正在尝试接受美国英语的网站,要获取阿拉伯语,您可以尝试将接受语言设置为“ ar”。但是,这不会为您将页面翻译成英文。