暴力语言检测

时间:2011-10-17 23:37:40

标签: java algorithm cryptography nlp

我需要一种算法(任何编程语言)来测试活力,使用爬山算法来破解加密挑战的密码。该算法应该测试随机解密(没有空格)是英文文本(也为不完整的单词提供分数!)或者只是随机字符序列的可能性。

我尝试了几种我开发的算法,但它们并不是那么好。

我的研究:

一个神秘的M4加密项目(http://www.bytereef.org/m4_project.html)也使用了我想要使用的Sinkov统计数据。

我发现的唯一的东西是«quebra -pedra»的文档,这是一个Java框架,包括我正在搜​​索的Sinkov对数权重分析。

http://www.google.com/m?client=ms-android-samsung&source=android-home#q=Quebra-pedra+framework+java

但我还没有找到下载框架的位置。此外,我还没有找到Sinkov测试的任何实现或描述。

我会很高兴任何提示。感谢。

1 个答案:

答案 0 :(得分:5)

我不知道Sinkov的统计数据,但是自然语言处理的语言模型可以完全按照你想要的方式进行,根据它与英语的相似程度对文本进行评分。

我在这里写了一个简单的字符二元组,它应该很容易理解。

https://github.com/rrenaud/Gibberish-Detector