Question

我正在解码一个二进制文件，它有四个字节表示的十进制数字，小端。例如，94 53 F0 40代表7.510202。不幸的是，Python给了我7.51020240784。

当我尝试使用unpack("<f",sampledata)[0]解析此数据时，由于Python存储值的方式，我无法得到原始数据的精确表示（有关详细信息，请参阅http://bugs.python.org/issue4114）。

不幸的是，我做需要获得完全相同的表示 - 无论有关浮动的不准确性的讨论，因为我需要将这些值写入文本文件，与最初使用./ / p>写入二进制文件的小数位数相同

如果可能，我宁愿坚持使用Python，但如果有必要，我很乐意在C中实现解决方案。我不能简单地截断unpack函数返回的原因是我无法保证原始float有多少小数位，例如0C 02 0F 41根据我的十六进制编辑器代表8.938，来自原始二进制文件，仅有3位小数。

要清楚，我需要将四个十六进制字节作为输入，并输出文本/ ASCII或IEEE 32位浮点数的数字表示，其具有与预期相同的小数位数。文件的创建者。输出我将用于创建原始二进制数据文件的CSV，而不是用于实际执行任何计算。

有什么建议吗？

示例：

from __future__ import print_function
from struct import *

print("Should print 7.510202")

hexbytes = b"\x94\x53\xF0\x40"

# 01101001 11001000 11110001 01000000
# should print 7.510202

print(unpack("<f",hexbytes)[0])

Answer 1

4字节IEEE格式浮点数大约保存7位数。你想要做的是将unpack的结果四舍五入到总共7位数。从那里，从float到string的正常Python转换将隐藏你的所有浮点肮脏。

def magnitude(x):
    return 0 if x==0 else int(math.floor(math.log10(abs(x)))) + 1

def round_total_digits(x, digits=7):
    return round(x, digits - magnitude(x))

>>> round_total_digits(struct.unpack('<f', '\x94\x53\xF0\x40')[0])
7.510202
>>> round_total_digits(struct.unpack('<f', '\x0C\x02\x0F\x41')[0])
8.938
>>> x = struct.unpack('<f', struct.pack('<f', 12345.67))[0]
>>> x
12345.669921875
>>> round_total_digits(x)
12345.67

请注意，如果您的数字不是来自直接转换十进制数，而是计算结果，则可能降低总精度。但不是很多。

Answer 2

  uint32_t b = 0x40F05394 + printf("");

  printf("%.11f\n", *(float *) &b);

在我的（小端）系统中打印：

7.51020240784

因此您需要使用f转化说明符打印更多数字。与python相同，您只需要请求打印的位数。

示例：

print "%.11f" % (unpack("<f",hexbytes)[0])

如果要打印的位数在文本文件中是可变的，则还必须将此信息存储在文本文件中。

然后在C中你可以打印出来：

      int p = 11;
      printf("%.*f\n", p, *(float *) &b);  // 11 here can be a variable

在Python中：

     p = 11
     print "%.*f" % (p, (unpack("<f",hexbytes)[0]))  # 11 can be a variable

当然要从0x40F05394获得0x9453F040，您只需要重新排列字节的顺序。

Answer 3

这是一个如何用小端编码和解码的例子。这并没有解决任何舍入问题，但看起来像是在上面的答案中解决了。

import csv, os
import struct

test_floats = [1.2, 0.377, 4.001, 5, -3.4]

## write test floats to a new csv file:
path_test_csv = os.path.abspath('data-test/test.csv')
print path_test_csv
test_csv = open(path_test_csv, 'w')
wr = csv.writer(test_csv)
for x in test_floats:
    wr.writerow([x])
test_csv.close()


## write test floats as binary
path_test_binary = os.path.abspath('data-test/test.binary')
test_binary = open(path_test_binary, 'w')
for x in test_floats:
    binary_data = struct.pack('<f', x)
    test_binary.write(binary_data)
test_binary.close()


## read in test binary
binary = open(path_test_binary, 'rb')
binary.seek(0,2) ## seeks to the end of the file (needed for getting number of bytes)
num_bytes = binary.tell() ## how many bytes are in this file is stored as num_bytes
# print num_bytes
binary.seek(0) ## seeks back to beginning of file
i = 0 ## index of bytes we are on
while i < num_bytes:
    binary_data = binary.read(4) ## reads in 4 bytes = 8 hex characters = 32-bits
    i += 4 ## we seeked ahead 4 bytes by reading them, so now increment index i
    unpacked = struct.unpack("<f", binary_data) ## <f denotes little endian float encoding
    print tuple(unpacked)[0]

如何将4字节IEEE（小端）浮点二进制表示转换为浮点数

3 个答案: