更改使用Selenium检索的page_source的编码

时间:2019-06-24 14:27:07

标签: python html selenium encoding

我希望检索某些站点的页面源,使用漂亮的汤将其转换为汤,然后将汤存储在csv文件中以供以后访问。但是,由于不同的站点使用不同的编码方案,因此使用iframe的srcdoc属性显示这些页面时,由于某些字符未在utf8中正确编码(这是我用于读取csv文件的编码),因此它们看起来有些变形。

我想知道是否有一种方法来获取用于站点的编码,然后使用该方法进行解码,然后将源编码为utf8?如果没有,还有其他方法可以解决此问题吗?

0 个答案:

没有答案