Question

我需要构建一个分类器，它将接收一个文件作为输入然后需要决定该文件的类型...例如，有效的分类可以是图像文件，电影文件，声音文件，文本文件带有字符数据，带有数字数据的文本文件

我正在考虑查看文件的二进制表示，然后构建机器学习算法。

有一个R包可以在我提供文件后为我提供文件的二进制表示吗？

Answer 1

您不一定需要包裹。您可以在二进制读取模式下打开文件，并使用readBin提取数据，无论您喜欢什么。 ?readBin帮助页

中的缩短版本

zz <- file("testbin", "wb")
writeBin(1:10, zz)
writeBin(pi, zz, endian = "swap")
writeBin(pi, zz, size = 4)
writeBin(pi+3i, zz)
writeBin("A test of a connection", zz)
z <- paste("A very long string", 1:100, collapse = " + ")
writeBin(z, zz)
close(zz)

zz <- file("testbin", "rb")
readBin(zz, integer(), 4)
readBin(zz, integer(), 6)
readBin(zz, numeric(), 1, endian = "swap")
readBin(zz, numeric(), size = 4)
readBin(zz, complex(), 1)
readBin(zz, character(), 1)
z2 <- readBin(zz, character(), 1)
close(zz)
unlink("testbin")

一旦你通过它的字节查看文件，就可以按照你想要的方式解释这些字节。

R如何获取文件的二进制表示

1 个答案: