标签: python html selenium encoding
我希望检索某些站点的页面源,使用漂亮的汤将其转换为汤,然后将汤存储在csv文件中以供以后访问。但是,由于不同的站点使用不同的编码方案,因此使用iframe的srcdoc属性显示这些页面时,由于某些字符未在utf8中正确编码(这是我用于读取csv文件的编码),因此它们看起来有些变形。
我想知道是否有一种方法来获取用于站点的编码,然后使用该方法进行解码,然后将源编码为utf8?如果没有,还有其他方法可以解决此问题吗?