使用vba进行网页抓取时出现的奇怪错误语言

时间:2018-11-29 21:56:58

标签: html vba ms-access web-scraping

我,每个人。 我向您提交了一个有时会发生的奇怪问题。 我写了一个VBA代码,从使用英语的网站上抓取数据。 因此,由于我需要将提取的数据与其他一些我想处理的数据进行比较,因此我一直希望它们是英文的,因此我可以在ACCESS表中找到它们。但是,碰巧该数据是德语的,这使我的研究无效。我已经分析了WEB页面,并且HTML代码始终是英语,但有时提取内容是德语。

实际上,我安装的MS Windows 10是德语版本,但这不会引起问题,因为我希望我在页面上阅读的语言(总是)是我提取的语言。 我要抓取的浏览器是Mozilla Firefox。

代码如下(在特殊部分上):

sAPPOGGIO = UrlWEB(1)
With CreateObject("msxml2.xmlhttp")
    .Open "GET", sAPPOGGIO, False
    .setRequestHeader "Content-Type", "text/xml"
    .setRequestHeader "User-Agent", "Mozilla/5.0 (Windows NT 6.1; rv:25.0) Gecko/20100101 Firefox/25.0"
    .send
     Do While .ReadyState <> 4
        DoEvents
        Pausa (2)
    Loop
    sHTM = .responseText
End With
'assegnazione dell pagina estratta
Set ohtm = New HTMLDocument
ohtm.body.innerHTML = sHTM

然后,在对象“ ohtm”内部工作时,有时提取的大部分时间都是用英语找到的。

有人冷漠地解释我发生了什么事吗?

0 个答案:

没有答案