我正在使用谷歌电子表格从HTML页面中提取一些书籍描述。
A1包含ISBN编号,在另一个单元格中我有=importXML("http://www.ibs.it/code/"&A1& "/scheda/libro.html","(//span[@class='tcorpotesto'])[1]")
。
它有效,但重音有问题。例如,在http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html上,其中一个词是'Perché',但单元格中的拼写文字是'Perch?'
我该如何解决这个问题?所有重音字符都是同样的问题。
答案 0 :(得分:0)
http://www.ibs.it/code/9788823503298/hornby-nick/febbre-90ordm.html处的文档使用ISO-8859-1编码。
Google使用UTF-8。
看来他们的importXML()实现并没有正确执行保留这些字符的字符集转换。您可以提供自己的代理/ Web服务,以内联方式运行翻译,或者提交请求上游修复的故障单。