完全相同的文件和代码。那么为什么我的docx文件的二进制文件总是以不同的方式结束?

时间:2013-08-20 17:51:42

标签: asp-classic httprequest binaryfiles docx

我们从服务器获取(未损坏的).docx文件,并通过httprequest发布到API。从API下载时它出现了损坏。我99%确定这取决于发布文件的代码,而不是API。

事实证明,损坏的文件在二进制文件中有一些额外的字符 - 我认为很容易找到它们的来源并删除它们。男孩,我错了。

我已经意识到每次发布文件时,二进制结尾都会略有不同。我们使用完全相同的文件,使用完全相同的代码。

有什么可以解释这种差异?

示例二进制结尾

0015 e88a 5060 0700 00da 3b00 000f 0000
0000 0000 0000 0000 0000 0060 1d00 0077
6f72 642f 7374 796c 6573 2e78 6d6c 504b
0506 0000 0000 0b00 0b00 

30秒后:

0015 e88a 5060 0700 00da 3b00 000f 0000
0000 0000 0000 0000 0000 0060 1d00 0077
6f72 642f 7374 796c 6573 2e78 6d6c 504b
0506 0000 0000 0b00 0b00 c102 00

另外30秒后:

0015 e88a 5060 0700 00da 3b00 000f 0000
0000 0000 0000 0000 0000 0060 1d00 0077
6f72 642f 7374 796c 6573 2e78 6d6c 504b
0506 0000 0000 0b00 0b00 c102 0000 ed24

发布代码

Sub PostTheFile(CVFile, fullFilePath, PostToURL)

    strBoundary = "---------------------------9849436581144108930470211272"
    strRequestStart = "--" & strBoundary & vbCrlf &_
        "Content-Disposition: attachment; name=""file""; filename=""" & CVFile & """" & vbcrlf & vbcrlf
    strRequestEnd = vbCrLf & "--" & strBoundary & "--" 

    Set stream = Server.CreateObject("ADODB.Stream")
        stream.Type = adTypeBinary 
        stream.Mode = adModeReadWrite     
        stream.Open
        stream.Write StringToBinary(strRequestStart)
        stream.Write ReadBinaryFile(fullFilePath)
        stream.Write StringToBinary(strRequestEnd)
        stream.Position = 0
        BINARYPOST= stream.read
        stream.Close

    Set stream = Nothing    

    Set httpRequest = Server.CreateObject("MSXML2.ServerXMLHTTP.6.0")
        httpRequest.Open "PATCH", PostToURL, False, "username", "pw"
        httpRequest.setRequestHeader "Content-Type", "multipart/form-data; boundary=""" & strBoundary & """"
        httpRequest.Send BINARYPOST
        Response.write "httpRequest.status: " & httpRequest.status 
    Set httpRequest = Nothing   
End Sub


Function StringToBinary(input)
    dim stream
    set stream = Server.CreateObject("ADODB.Stream")
        stream.Charset = "UTF-8"
        stream.Type = adTypeText 
        stream.Mode = adModeReadWrite 
        stream.Open
        stream.WriteText input
        stream.Position = 0
        stream.Type = adTypeBinary 
        StringToBinary = stream.Read
        stream.Close
    set stream = Nothing
End Function

Function ReadBinaryFile(fullFilePath) 
    dim stream
    set stream = Server.CreateObject("ADODB.Stream")
        stream.Type = 1
        stream.Open()
        stream.LoadFromFile(fullFilePath)
        ReadBinaryFile = stream.Read()
        stream.Close
    set stream = nothing
end function 

更新

我们玩了几个不同的边界和Charsets。

UTF-8还有一些额外的BOM。

http://wikipedia.org/wiki/Byte_order_mark

现在问题显然是添加(看似随机数量)NULL /零填充。

E.g。第一次增加13套“00”。点击刷新,第二次添加8.第三次添加7.每次使用完全相同的文件和代码。

建议 - 这有多可能?

帖子的目标网址是https - 所以朋友建议我们的服务器可能已经识别了这一点并添加了随机填充作为加密的一部分。这听起来不太可能,但我没有更好的建议。

1 个答案:

答案 0 :(得分:0)

我发现了一个类似的问题:

Error in downloaded pdf file - ASP classic

以下是一些提示:

  • 将Stream .Mode属性设置为3
  • 将Response.ContentType设置为“xxx / xxx”
  • 在开始添加响应标头之前,您应该调用Response.Clear(以确保您没有发送额外的标记)(这看起来非常相似)

希望这会有所帮助: - )