源中的Xpath重音

时间:2014-09-22 22:23:02

标签: xpath google-sheets

我正在使用谷歌电子表格从HTML页面中提取一些书籍描述。

A1包含ISBN编号,在另一个单元格中我有=importXML("http://www.ibs.it/code/"&A1& "/scheda/libro.html","(//span[@class='tcorpotesto'])[1]")

它有效,但重音有问题。例如,在http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html上,其中一个词是'Perché',但单元格中的拼写文字是'Perch?'

我该如何解决这个问题?所有重音字符都是同样的问题。

1 个答案:

答案 0 :(得分:0)

http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html处的文档使用ISO-8859-1编码。

Google使用UTF-8。

看来他们的importXML()实现并没有正确执行保留这些字符的字符集转换。您可以提供自己的代理/ Web服务,以内联方式运行翻译,或者提交请求上游修复的故障单。