如何用Ruby读取这个二进制XML响应?

时间:2017-10-04 12:44:23

标签: ruby xml binary binary-data

我正在尝试阅读来自市场网络服务的回复。此Web服务的每个其他响应都以XML格式返回。但是,此特定呼叫请求文件下载。我不熟悉它的返回方式。在查看内容之后,存在XML以及编码的二进制数据,其中存在某种附件。

我提出的请求看起来像这样。该请求是一个简单的XML请求:

  begin
    response = Net::HTTP.start(url.host, url.port, :use_ssl => url.scheme == 'https') do |http|
      http.verify_mode = OpenSSL::SSL::VERIFY_NONE
      http.request(request)
    end
  rescue Errno::ECONNRESET => e
    count += 1
    retry unless count > 10
    puts "Tried 10 times and couldn't get #{url.host}: #{e}"
  end

以下是response.body的样子:

--MIMEBoundaryurn_uuid_AF2837F4196B2631EC15070889135182607126
Content-Type: application/xop+xml; charset=utf-8; type="text/xml"
Content-Transfer-Encoding: binary
Content-ID: <0.urn:uuid:AF2837F4196B2631EC15070889135182607127>

<?xml version='1.0' encoding='UTF-8'?>
<downloadFileResponse xmlns="http://www.marketplace.com/marketplace/services">
  <ack>Success</ack>
  <version>1.1.0</version>
  <timestamp>2017-10-04T03:48:33.518Z</timestamp>
  <fileAttachment>
    <Size>25895</Size>
    <Data><xop:Include xmlns:xop="http://www.w3.org/2004/08/xop/include" href="cid:urn:uuid:E3A8215C82DBC51E6D1507090865513"/></Data>
  </fileAttachment>
</downloadFileResponse>

--MIMEBoundaryurn_uuid_AF2837F4196B2631EC15070889135182607126
Content-Type: application/zip
Content-Transfer-Encoding: binary
Content-ID: <urn:uuid:E3A8215C82DBC51E6D1507090865513>

PK&úCKÃEK¬gdi∂6509805153_report.xmlUT   hH‘YhH‘Yux00ÏùÎs‚8∂¿ø˜_°€üÓ≠=-â Ù6ÚÍ< ›”≥µïr@   NåÕ⁄&è˘ÎØÑÅêàçÕ‡…¶+ùnåd=|Œ—œÁ˱ۜáæÓT:æ˜Îg¥?Âu¸Æ„]ˇ˙y]ïƒÁ~˘¥≥;tokvd◊:=€ªVM|/T!–˘ΩP'
º≤∫¥Àˆ¿ Àj˜x◊U’ÔÎT ã¬œ˙-flÌ6’¿¢/ü>Ìú]‘Td;n¯e¸Ò∞ˆ L%‰åqÀ*!é, òdB±≥=Ic™Û®ÇÛpÙ©ÁªÆ≥ŸA∏≥=˚≈8ŸûÑ—©›W_v˛Á_’Z•]˘W€$Ó‹˛˚fl_∆9û“å3€/Ûòbº)œ4…8KΩØõÚî>äÀË≈Ÿ˛Ít\ÿ›Í¯˝ß{ƒy∆7hÙt_=›ÄC$·Ä3åürƒâtgˆúASuúÅ£ªwnοlç_'èo—ä•"ÙîAÇ)–ÆÔ{˜ v£ÿuÔ∫”õL2Ãf«œæ√„Ô™NÙ¯ºb{∂\Ÿ”{MSLnfGÍ,h˛ù„ufÚ}ØÃˇ<Mú≥·áëÌV˝ÓL&åuKJÿBhöy&Ÿ∏䲖ãǵ<o=UpÊ˚8«@ÎEKwŒl˝Œ-∞Ë¥O›4õÓ”N√~ÏÎ~Ø∫ T∑ÌË€aàx   ¡$mƒ 
...
--MIMEBoundaryurn_uuid_AF2837F4196B2631EC15070889135182607126--

显然我可以看到这里有拉链数据。但我已经阅读了Hash.from_xml的所有其他回复,显然这不会起作用。

Update 如果我将字符串写入文件test.zip,我可以在Linux命令行解压缩它,并在闪烁此警告后创建一个可读的XML文件:

Archive:  test.zip
warning [test.zip]:  822 extra bytes at beginning or within zipfile
  (attempting to process anyway)
  inflating: 6509805153_report.xml   

不确定它抱怨的额外字节是什么。

Update 2 这绝对是MIME标头和XML信封。我可以确认,如果我手动剥离这些字符和MIME页脚,那么测试文件会在没有警告的情况下解压缩。

所以这似乎是一个包含zip文件的压缩XML信封。

1 个答案:

答案 0 :(得分:1)

这可能比仅使用库更复杂一些。我能找到的最近的是savon SOAP库中的一个实现,它在多部分响应中处理xop。您可能能够分析那里的代码并提出适合您需求的解决方案,或者如果这是一个SOAP服务,则可以利用savon gem。

https://github.com/savonrb/savon-multipart/blob/master/lib/savon/multipart/response.rb#L63-L80