问题:http://www.cryptopals.com/sets/1/challenges/4
我以前已经用C完成了这个问题,但是我想在Go中做一个更通用的解决方案(当我达到与C中任意目标匹配的字符串时,我只是停止检查字符串的英语性,现在我想要的是全部)。
我的解决方案对于第3个挑战字符串可以很好地工作,但是当我尝试第4个挑战时,我只会得到垃圾。更令人不安的是,我什至看不到XOR生成的字符串集合中的正确字符串(我将它们全部打印到文件中)。我试图更改我从文本文件中提取字符串的方式(这就是为什么我使用了一种不太标准的方法来提取字符串),但是没有效果。
挑战3的字符串为“ 1b37373331363f78151b7f2b783431333d78397828372d363c78373e783a393b3736”,该字符串应正常输出“烹饪MC像一磅熏肉”。挑战4是一个包含300条奇数行的文件,其中只有一个是正确的解码行。它应该解密为“现在聚会正在跳跃”,但是我只得到“ U +] Ex(unprintable)NSqhe /] PuSE7Nr; Rw; OUqeas”。我已经能够获得几个不同的输出,但是从来没有正确的输出。
func main() {
filebytes, err := ioutil.ReadFile("4.txt")
if err != nil {
log.Fatal(err)
}
filestring := string(filebytes)
lines := strings.Split(filestring, "\n")
bestGuess := challenge4.GuessFile(lines)
fmt.Println(bestGuess)
}
func GuessFile(lines []string) string {
guessArray := make([]string, len(lines))
for i, line := range lines {
bytes, err := hex.DecodeString(line)
if err != nil {
log.Fatal(err)
}
guessArray[i] = challenge3.GuessString(bytes)
}
return utilities.MostEnglish(guessArray)
}
func GuessString(b []byte) string {
guessArray := make([]string, 256)
for i := 0; i < 256; i++ {
guessArray[i] = string(utilities.SbXor(b, byte(i)))
}
return utilities.MostEnglish(guessArray)
}
// MostEnglish takes a slice of strings and returns the string most likely to
// be an English sentence.
func MostEnglish(s []string) string {
var maxVal uint64
var maxStr string
for _, line := range s {
val := EnglishFreq(line)
if val != 0 {
if val > maxVal {
maxVal, maxStr = val, line
}
}
}
return maxStr
}
// EnglishFreq takes a string and returns the value representing
// the likelihood the string is a valid English sentence based on word frequency
func EnglishFreq(s string) uint64 {
var total uint64
alphaFreq := map[rune]uint64{
'A': 816,
'B': 149,
'C': 278,
'D': 425,
'E': 1270,
'F': 222,
'G': 201,
'H': 609,
'I': 696,
'J': 15,
'K': 77,
'L': 402,
'M': 240,
'N': 674,
'O': 750,
'P': 192,
'Q': 9,
'R': 598,
'S': 632,
'T': 905,
'U': 275,
'V': 236,
'W': 20,
'X': 15,
'Y': 197,
'Z': 7,
}
for _, char := range s {
if !unicode.IsPrint(char) {
return 0
}
if val, ok := alphaFreq[unicode.ToUpper(char)]; ok {
total += val
}
}
return total
}
//SbXor does a single byte xor against a provided byte array
func SbXor(arr []byte, b byte) []byte {
for i := range arr {
arr[i] ^= b
}
return arr
}
答案 0 :(得分:0)
您的得分函数EnglishFreq
有缺陷。您将忽略包含至少一个不可打印字符的纯文本候选。但是,有些有效的纯文本确实包含其中一个或多个。例如:
package main
import (
"testing"
"unicode"
)
func EnglishFreq(s string) uint64 {
var total uint64
alphaFreq := map[rune]uint64{
'A': 816, 'B': 149, 'C': 278, 'D': 425, 'E': 1270, 'F': 222, 'G': 201,
'H': 609, 'I': 696, 'J': 15, 'K': 77, 'L': 402, 'M': 240, 'N': 674,
'O': 750, 'P': 192, 'Q': 9, 'R': 598, 'S': 632, 'T': 905, 'U': 275,
'V': 236, 'W': 20, 'X': 15, 'Y': 197, 'Z': 7,
}
for _, char := range s {
if !unicode.IsPrint(char) {
return 0
}
if val, ok := alphaFreq[unicode.ToUpper(char)]; ok {
total += val
}
}
return total
}
func TestEnglishFreq(t *testing.T) {
if s := "foo\nbar"; EnglishFreq(s) == 0 {
t.Errorf("EnglishFreq(%q) == 0, want > 0", s)
}
}
// $ go test
// --- FAIL: TestEnglishFreq (0.00s)
// main_test.go:31: EnglishFreq("foo\nbar") == 0, want > 0
不要仅仅因为潜在的纯文本包含一个不可打印的字符就将其丢弃。而是降低每个此类角色的分数。这对于以后的挑战也很重要。
我在an answer on Cryptography Stack Exchange中提出的卡方检验方面取得了成功。