来自gist上的原始xml的importxml会产生错误

时间:2017-03-28 02:21:43

标签: xpath google-sheets xml-parsing

我在Gist上有一个原始的xml文件: https://gist.githubusercontent.com/EmDubeu/196d95b561fa83a4ef360654ed919fe5/raw/9e2dde8d08a2ea4e45871bf8c55693334f8a69e1/NEIPA.xml

我将上述网址存储在我的Google电子表格(Settings!E27)的单元格中。

我正在尝试使用以下公式从我的Google工作表中使用importxml: =IMPORTXML(Settings!E27, "//HOP/NAME"),但它返回“错误导入的Xml内容无法解析。”

我的公式适用于此网址: http://www.beerxml.com/recipes.xml

为什么它不能使用我的Gist托管的xml文件?

2 个答案:

答案 0 :(得分:0)

<?xml version="1.0" encoding="ISO-8859-1"?><RECIPES>

之间插入一个分隔线

答案 1 :(得分:0)

GitHub不适用于文件托管,Content-Type标头未正确设置。如果您在浏览器中键入http://www.beerxml.com/recipes.xml,它会将页面呈现为XML内容,但不会呈现给您https://gist.githubusercontent.com/EmDubeu/ ...因为它无法将其识别为XML页面。

在这种情况下,人们(至少我)通常使用像https://rawgit.com/这样的网站。对于您的gist文件,rawgit URL为https://rawgit.com/EmDubeu/196d95b561fa83a4ef360654ed919fe5/raw/fcb019a0db249ea90a9512f9162725547f4a43b5/NEIPA.xml

但是当我输入此网址时,我的浏览器会因为&这样的字符而无法解析网页。它应该是HTML(XML) character encoded。您可以通过查看http://www.beerxml.com/recipes.xml的来源来验证这一点,其中&已正确编码为&amp;。你也应该对你的要点进行html编码。