我正试图从可公开访问的娱乐信息数据库中提取信息。我正在尝试解析的Feed是http://www.recdata.gov/feeds/RecElements/getAllRecElementsForOrgID_-1.xml(大文件)
似乎feed是一个复杂的xml文档,看起来它有很多类似于数据库中引用表的信息引用。关于如何处理这个问题会有什么建议?有更好的消费方式吗?我需要尽可能多地从Feed中获取信息,并且所有的弧元素都让我感到沮丧。
答案 0 :(得分:1)
在他们的网站上稍微戳了一下,我找到了他们的Web Service Manual。这表明他们为每个服务公开了一个WSDL。用于获取数据的服务的WSDL位于https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL。
请注意,XMLspy表示此WSDL出错:
File https://www.recdata.gov/RIDBWebService/RIDBService.jws?WSDL is not valid.
attribute 'part' in extensibility element '<mime:mimeXml>' refers to part 'Body' which could not be found in message 'getRecGovFacilitiesHttpGetOut'
Error location: definitions / binding / operation / output / mime:mimeXml / @part
因此,处理此服务的一种方法是使用WSDL以您喜欢的语言生成代理类。例如,如果您使用的是.NET,则可以使用“添加服务引用”命令并将其指向WSDL。