应用错误收集

源中的Xpath重音

时间：2014-09-22 22:23:02

标签： xpath google-sheets

我正在使用谷歌电子表格从HTML页面中提取一些书籍描述。

A1包含ISBN编号，在另一个单元格中我有=importXML("http://www.ibs.it/code/"&A1& "/scheda/libro.html","(//span[@class='tcorpotesto'])[1]")。

它有效，但重音有问题。例如，在http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html上，其中一个词是'Perché'，但单元格中的拼写文字是'Perch？'

我该如何解决这个问题？所有重音字符都是同样的问题。

1 个答案:

答案 0 :(得分：0)

http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html处的文档使用ISO-8859-1编码。

Google使用UTF-8。

看来他们的importXML（）实现并没有正确执行保留这些字符的字符集转换。您可以提供自己的代理/ Web服务，以内联方式运行翻译，或者提交请求上游修复的故障单。