.xml网址,输出数据中没有任何格式

时间:2018-10-19 10:37:24

标签: xml

我迷路了,请帮助。

我的客户端通过.xml输出URL发送(由于NDA,无法共享)。我之前使用过XML数据,通常它具有标签,元素,格式等。而且我能够轻松地将其拉入到csv文件的转换器中。这次没有那么多。该url的输出数据实际上只是一个数据转储,没有任何分隔符,逗号,标签,元素。实际上,我什至不认为这种格式在技术上可以将其视为XML。这是数据的示例:

例如:123streetin一个不错的区域$ 1000image photo.jpglink test.com

从字面上看,成千上万行未格式化的数据就是这样。句子看起来很长一段时间,但更糟的是,字段之间缺少空格。看起来好像以前有分隔符或元素,并且它们被剥离了。

我的目标是将其提取到格式正确的xml中,然后转换为.csv。是否可以像下面的示例那样将其提取为某种格式?

<address>123 Street</address>
<description>in a nice area</description>
<price>$1000</price>
<image>image photo.jpg</image>
<url>test.com</url>

1 个答案:

答案 0 :(得分:0)

在浏览器中打开XML数据时,它会尝试将其呈现为HTML格式-通常是因为服务器无法提供适当的内容类型标头。

大多数标记将不匹配任何HTML元素,因此它会以文本形式呈现。通常的症状是看到“格式错误的文本”。

在您的情况下,似乎您已经获得了XML响应,因此您只需要解析实际的文本输出即可。您可以通过右键单击页面并选择“查看源代码”来查看它。