�废除口音问题cheerio iso-8859-1

时间:2018-08-20 19:09:34

标签: javascript node.js cheerio

我正在尝试删除一个网站,但该网站以éè之类的所有口音让我和其他人返回。我试图通过这种方式使用iconv lite,但是它不起作用..但是我不知道该如何处理

帮助

options = {
            uri: 'https://www.weebsite.com/' + page,
            headers: {
                'Host': 'www.site.com',
                'Content-Encoding' : 'ISO-8859-1',
                'Accept-Encoding' : 'ISO-8859-1',
                'Content-Type': 'text/html; charset=ISO-8859-1',
                'Connection': 'keep-alive',
                'Pragma': 'no-cache',
                'Cache-Control': 'no-cache',
                'Upgrade-Insecure-Requests': '1',
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36',
                'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
                'Accept-Language': 'fr-FR,fr;q=0.9,en-US;q=0.8,en;q=0.7',
                'Vary' : 'Accept-Encoding'
            },
            jar: cookiejar,
            transform: function (body) {
              // return cheerio.load(body);
              return cheerio.load(iconv.decode(body, 'iso-8859-1'));

            }
          };


          rp(options)
          .then(function (p$) {
            var need = p$('.H1_titre').text()
          })
          .catch(function (err) {

          });

0 个答案:

没有答案