我需要构建一个分类器,它将接收一个文件作为输入然后需要决定该文件的类型...例如,有效的分类可以是图像文件,电影文件,声音文件,文本文件带有字符数据,带有数字数据的文本文件
我正在考虑查看文件的二进制表示,然后构建机器学习算法。
有一个R包可以在我提供文件后为我提供文件的二进制表示吗?
答案 0 :(得分:2)
您不一定需要包裹。您可以在二进制读取模式下打开文件,并使用readBin
提取数据,无论您喜欢什么。 ?readBin
帮助页
zz <- file("testbin", "wb")
writeBin(1:10, zz)
writeBin(pi, zz, endian = "swap")
writeBin(pi, zz, size = 4)
writeBin(pi+3i, zz)
writeBin("A test of a connection", zz)
z <- paste("A very long string", 1:100, collapse = " + ")
writeBin(z, zz)
close(zz)
zz <- file("testbin", "rb")
readBin(zz, integer(), 4)
readBin(zz, integer(), 6)
readBin(zz, numeric(), 1, endian = "swap")
readBin(zz, numeric(), size = 4)
readBin(zz, complex(), 1)
readBin(zz, character(), 1)
z2 <- readBin(zz, character(), 1)
close(zz)
unlink("testbin")
一旦你通过它的字节查看文件,就可以按照你想要的方式解释这些字节。