卡在Googles挑战者4中

时间:2018-10-24 13:03:01

标签: go cryptography nlp xor

问题:http://www.cryptopals.com/sets/1/challenges/4

我以前已经用C完成了这个问题,但是我想在Go中做一个更通用的解决方案(当我达到与C中任意目标匹配的字符串时,我只是停止检查字符串的英语性,现在我想要的是全部)。

我的解决方案对于第3个挑战字符串可以很好地工作,但是当我尝试第4个挑战时,我只会得到垃圾。更令人不安的是,我什至看不到XOR生成的字符串集合中的正确字符串(我将它们全部打印到文件中)。我试图更改我从文本文件中提取字符串的方式(这就是为什么我使用了一种不太标准的方法来提取字符串),但是没有效果。

挑战3的字符串为“ 1b37373331363f78151b7f2b783431333d78397828372d363c78373e783a393b3736”,该字符串应正常输出“烹饪MC像一磅熏肉”。挑战4是一个包含300条奇数行的文件,其中只有一个是正确的解码行。它应该解密为“现在聚会正在跳跃”,但是我只得到“ U +] Ex(unprintable)NSqhe /] PuSE7Nr; Rw; OUqeas”。我已经能够获得几个不同的输出,但是从来没有正确的输出。

 func main() {
    filebytes, err := ioutil.ReadFile("4.txt")
    if err != nil {
        log.Fatal(err)
    }
    filestring := string(filebytes)
    lines := strings.Split(filestring, "\n")
    bestGuess := challenge4.GuessFile(lines)
    fmt.Println(bestGuess)
}

func GuessFile(lines []string) string {
    guessArray := make([]string, len(lines))
    for i, line := range lines {
        bytes, err := hex.DecodeString(line)
        if err != nil {
            log.Fatal(err)
        }
        guessArray[i] = challenge3.GuessString(bytes)
    }
    return utilities.MostEnglish(guessArray)
}


func GuessString(b []byte) string {
    guessArray := make([]string, 256)
    for i := 0; i < 256; i++ {
        guessArray[i] = string(utilities.SbXor(b, byte(i)))
    }
    return utilities.MostEnglish(guessArray)
}


    // MostEnglish takes a slice of strings and returns the string most likely to
// be an English sentence.
func MostEnglish(s []string) string {
    var maxVal uint64
    var maxStr string
    for _, line := range s {

        val := EnglishFreq(line)
        if val != 0 {

            if val > maxVal {
                maxVal, maxStr = val, line
            }
        }
    }
    return maxStr
}

// EnglishFreq takes a string and returns the  value representing
// the likelihood the string is a valid English sentence based on word frequency
    func EnglishFreq(s string) uint64 {
    var total uint64
    alphaFreq := map[rune]uint64{
        'A': 816,
        'B': 149,
        'C': 278,
        'D': 425,
        'E': 1270,
        'F': 222,
        'G': 201,
        'H': 609,
        'I': 696,
        'J': 15,
        'K': 77,
        'L': 402,
        'M': 240,
        'N': 674,
        'O': 750,
        'P': 192,
        'Q': 9,
        'R': 598,
        'S': 632,
        'T': 905,
        'U': 275,
        'V': 236,
        'W': 20,
        'X': 15,
        'Y': 197,
        'Z': 7,
    }

    for _, char := range s {
        if !unicode.IsPrint(char) {
            return 0
        }
        if val, ok := alphaFreq[unicode.ToUpper(char)]; ok {
            total += val
        }
    }
    return total
}
//SbXor does a single byte xor against a provided byte array
func SbXor(arr []byte, b byte) []byte {
    for i := range arr {
        arr[i] ^= b
    }
    return arr
}

1 个答案:

答案 0 :(得分:0)

您的得分函数EnglishFreq有缺陷。您将忽略包含至少一个不可打印字符的纯文本候选。但是,有些有效的纯文本确实包含其中一个或多个。例如:

package main

import (
        "testing"
        "unicode"
)

func EnglishFreq(s string) uint64 {
        var total uint64
        alphaFreq := map[rune]uint64{
                'A': 816, 'B': 149, 'C': 278, 'D': 425, 'E': 1270, 'F': 222, 'G': 201,
                'H': 609, 'I': 696, 'J': 15, 'K': 77, 'L': 402, 'M': 240, 'N': 674,
                'O': 750, 'P': 192, 'Q': 9, 'R': 598, 'S': 632, 'T': 905, 'U': 275,
                'V': 236, 'W': 20, 'X': 15, 'Y': 197, 'Z': 7,
        }

        for _, char := range s {
                if !unicode.IsPrint(char) {
                        return 0
                }
                if val, ok := alphaFreq[unicode.ToUpper(char)]; ok {
                        total += val
                }
        }
        return total
}

func TestEnglishFreq(t *testing.T) {
        if s := "foo\nbar"; EnglishFreq(s) == 0 {
                t.Errorf("EnglishFreq(%q) == 0, want > 0", s)
        }
}

// $ go test
// --- FAIL: TestEnglishFreq (0.00s)
//     main_test.go:31: EnglishFreq("foo\nbar") == 0, want > 0

不要仅仅因为潜在的纯文本包含一个不可打印的字符就将其丢弃。而是降低每个此类角色的分数。这对于以后的挑战也很重要。

我在an answer on Cryptography Stack Exchange中提出的卡方检验方面取得了成功。