我迷路了,请帮助。
我的客户端通过.xml输出URL发送(由于NDA,无法共享)。我之前使用过XML数据,通常它具有标签,元素,格式等。而且我能够轻松地将其拉入到csv文件的转换器中。这次没有那么多。该url的输出数据实际上只是一个数据转储,没有任何分隔符,逗号,标签,元素。实际上,我什至不认为这种格式在技术上可以将其视为XML。这是数据的示例:
例如:123streetin一个不错的区域$ 1000image photo.jpglink test.com
从字面上看,成千上万行未格式化的数据就是这样。句子看起来很长一段时间,但更糟的是,字段之间缺少空格。看起来好像以前有分隔符或元素,并且它们被剥离了。
我的目标是将其提取到格式正确的xml中,然后转换为.csv。是否可以像下面的示例那样将其提取为某种格式?
<address>123 Street</address>
<description>in a nice area</description>
<price>$1000</price>
<image>image photo.jpg</image>
<url>test.com</url>
答案 0 :(得分:0)
在浏览器中打开XML数据时,它会尝试将其呈现为HTML格式-通常是因为服务器无法提供适当的内容类型标头。
大多数标记将不匹配任何HTML元素,因此它会以文本形式呈现。通常的症状是看到“格式错误的文本”。
在您的情况下,似乎您已经获得了XML响应,因此您只需要解析实际的文本输出即可。您可以通过右键单击页面并选择“查看源代码”来查看它。