所以我有一个文件,其中包含大量成对的十六进制数字,以及' NA' /缺少数据符号" ??"。
A4 BB 08 6F E7 88 D9 10 11 12 AC CB C8 CC #Row of data in the file.
?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? ?? #Row of missing data in the file.
我试图将所有这些内容输入管道,并深入了解每个十六进制数字的频率,从0到256.到目前为止,我使用'读取表格将其读入一个结构中。命令(称之为测试),我真的不确定从那里做什么。我已经做了很多不同的事情试图压制线条" ??"在任何列中,然后将其余的值转换为十六进制值,并从中获得有用的东西。如果有人能指出我完成这项任务所需的工具,我会非常感激。
编辑: 根据请求输出dput。
structure(list(V2 = structure(c(88L, 209L, 124L, 91L, 132L, 235L
), .Label = c("??", "00", "01", "02", "03", "04", "05", "06",
"07", "08", "09", "0A", "0B", "0C", "0D", "0E", "0F", "10", "11",
"12", "13", "14", "15", "16", "17", "18", "19", "1A", "1B", "1C",
"1D", "1E", "1F", "20", "21", "22", "23", "24", "25", "26", "27",
"28", "29", "2A", "2B", "2C", "2D", "2E", "2F", "30", "31", "32",
"33", "34", "35", "36", "37", "38", "39", "3A", "3B", "3C", "3D",
"3E", "3F", "40", "41", "42", "43", "44", "45", "46", "47", "48",
"49", "4A", "4B", "4C", "4D", "4E", "4F", "50", "51", "52", "53",
"54", "55", "56", "57", "58", "59", "5A", "5B", "5C", "5D", "5E",
"5F", "60", "61", "62", "63", "64", "65", "66", "67", "68", "69",
"6A", "6B", "6C", "6D", "6E", "6F", "70", "71", "72", "73", "74",
"75", "76", "77", "78", "79", "7A", "7B", "7C", "7D", "7E", "7F",
"80", "81", "82", "83", "84", "85", "86", "87", "88", "89", "8A",
"8B", "8C", "8D", "8E", "8F", "90", "91", "92", "93", "94", "95",
"96", "97", "98", "99", "9A", "9B", "9C", "9D", "9E", "9F", "A0",
"A1", "A2", "A3", "A4", "A5", "A6", "A7", "A8", "A9", "AA", "AB",
"AC", "AD", "AE", "AF", "B0", "B1", "B2", "B3", "B4", "B5", "B6",
"B7", "B8", "B9", "BA", "BB", "BC", "BD", "BE", "BF", "C0", "C1",
"C2", "C3", "C4", "C5", "C6", "C7", "C8", "C9", "CA", "CB", "CC",
"CD", "CE", "CF", "D0", "D1", "D2", "D3", "D4", "D5", "D6", "D7",
"D8", "D9", "DA", "DB", "DC", "DD", "DE", "DF", "E0", "E1", "E2",
"E3", "E4", "E5", "E6", "E7", "E8", "E9", "EA", "EB", "EC", "ED",
"EE", "EF", "F0", "F1", "F2", "F3", "F4", "F5", "F6", "F7", "F8",
"F9", "FA", "FB", "FC", "FD", "FE", "FF"), class = "factor"),
还有许多其他专栏。我把它们关掉了,因为它们具有相同的~257个标签值,或者在这里或那里取一个十六进制值。
as.hexmode(名称(测试))导致了同样的问题,无法强迫x' x'到hexmode。编辑:好的,我取得了一些成功,并且我做了我想做的事情或多或少。
首先我想合并列,因为我只想要对事件进行总体计数(这甚至可能是不必要的)
test2 <-
c(as.character(test[,1]),as.character(test[,2]),as.character(test[,3]),as.character(test[,4]),
as.character(test[,5]), as.character(test[,6]), as.character(test[,7]),
as.character(test[,8]), as.character(test[,9]), as.character(test[,10]),
as.character(test[,11]), as.character(test[,12]), as.character(test[,13]),
as.character(test[,14]), as.character(test[,15]), as.character(test[,16]))
然后我只想要每个值的计数:
table(test2)
不转换为整数或任何必要的恶作剧。我感觉不止一点点愚蠢,但是哦。我仍然很好奇,如果有更好的方法来获得每个值的所有行和列的整体计数,就像我做的那样看起来很笨拙。
编辑: 最终答案是(按照我原来的命名惯例):
table(unlist(lapply(test, as.character)))
谢谢BondedDust。
答案 0 :(得分:2)
看看你是否取得了一些成功:
as.hexmode ( names(test) )
您提供的输出表明已创建表对象,并且第一行将是在这些十六进制字符下方看到的条目的names
(在字符模式下)。目前尚不清楚您是否在控制台上显示外部文本文件或输出的内容,因此这可能是一个WAG。
> res <- scan(what="")
1: A4 BB 08 6F E7 88 D9 10 11 12 AC CB C8 CC
15:
Read 14 items
> as.hexmode(res)
[1] "a4" "bb" "08" "6f" "e7" "88" "d9" "10" "11" "12" "ac" "cb" "c8" "cc"
> dput( as.hexmode(res) )
structure(c(164L, 187L, 8L, 111L, 231L, 136L, 217L, 16L, 17L,
18L, 172L, 203L, 200L, 204L), class = "hexmode")