应用错误收集

我希望检索某些站点的页面源，使用漂亮的汤将其转换为汤，然后将汤存储在csv文件中以供以后访问。但是，由于不同的站点使用不同的编码方案，因此使用iframe的srcdoc属性显示这些页面时，由于某些字符未在utf8中正确编码（这是我用于读取csv文件的编码），因此它们看起来有些变形。

我想知道是否有一种方法来获取用于站点的编码，然后使用该方法进行解码，然后将源编码为utf8？如果没有，还有其他方法可以解决此问题吗？