Python - 读取和编写结构化二进制文件

时间:2017-09-22 05:38:19

标签: python arrays python-2.7 numpy binaryfiles

目前我正试图操纵一种二进制文件, 结构是这样的:

FileHeader + [SectionHeader + Binary(1D-array)] * NumSetions

在互联网上搜索后,我想出了以下代码来阅读它:

import numpy as np

# Always BIG Endian
#file_header bytes: 12
file_header_dtype = np.dtype([
    ('nsection', '>i4'), # number of sections
    ('nsample', '>i4'), # number of samples for each section
    ('dt', '>f4'), # sampling rate
    ])

#section_header bytes: 28
section_header_dtype = np.dtype([
    ('rec', '>i4'), # record number
    ('x', '>f8'), # x, in meter
    ('y', '>f8'), # y, in meter
    ('z', '>f8'), # z, in meter
    ])

def dtype_section(nt):
    return np.dtype(section_header_dtype.descr + [('binary', ('>f4',nt))])

def read_file_header(_file):
    with open(_file, 'rb') as f:
        file_header = np.fromstring(f.read(12), dtype=file_header_dtype)
    return file_header

def readFile(filename):
    raw = open(filename, 'rb')
    file_header = np.fromstring(raw.read(12), dtype=file_header_dtype)
    nt = file_header['nsample'][0]
    dtype_file_sections = dtype_section(nt)
    data = np.fromstring(raw.read(), dtype=dtype_file_sections)
    return (file_header, data)

通过这种方式,我可以轻松调用标题条带二进制部分并执行plt.imshow或其他任何内容。

data = readFile('site1.bin')
data_arr = data[1]['binary']
#plt.imshow(data_arr)

问题是,我找不到在保持相同数据结构的同时输出数据的方法

ndarray.tofile()每次仅适用于一个数组

np.array((data[0],data[1])).tofile('test')会导致IOError

  

IOError:无法以二进制模式将对象数组写入文件

我对Python很陌生,我不确定我是否犯了错误。 或者我应该考虑另一种方式来阅读此类文件,而不是使用numpy.dtype? 请帮帮我。

1 个答案:

答案 0 :(得分:2)

直接的方法是简单地写入二进制文件:

with open('test','wb') as f:
    f.write(data[0].tobytes())
    f.write(data[1].tobytes())