无法更改语言以获得所需的输出

时间:2018-06-28 13:05:25

标签: python python-3.x web-scraping beautifulsoup

我用python编写了一个脚本来获取网站的内容(以表格格式)。当我执行脚本时,它会成功解析该内容。我唯一不能修改的是language选项。

该网站的内容使用Arabic语言。但是,我的目的是以一种这样的方式进行解析,以使我得到的输出是英语。这就是我卡住的地方。我根据this answer尝试了headers={"Accept-Language":"en-US,en;q=0.9"},但在这种情况下似乎不起作用。如何更改语言选项以达到目的?

这是我的脚本:

import requests
from bs4 import BeautifulSoup

URL = "http://www.awm.gov.jo/dotnet/default.aspx"

req = requests.get(URL,headers={"Accept-Language":"en-US,en;q=0.9"})
soup = BeautifulSoup(req.text,"lxml")
for items in soup.select("#GV_prices tr"):
    data = [item.get_text(strip=True) for item in items.select("th,td")]
    print(data)

仅供参考,这是我第一次尝试headers={"Accept-Language": "en-US,en;q=0.5"},但也没有用。

1 个答案:

答案 0 :(得分:0)

您正在尝试接受美国英语的网站,要获取阿拉伯语,您可以尝试将接受语言设置为“ ar”。但是,这不会为您将页面翻译成英文。