根据我的需要编辑此脚本

时间:2016-04-30 23:30:47

标签: regex bash shell grep

我想使用此脚本来构建自定义Wordlist。 Wordlist Script

此脚本将构建仅包含loweralpha Chars的Wordlist。但我想要较低/较高的字符和数字。 输出应该像这样的例子:

test
123test
test123
Test
123Test
Test123

我不知道如何改变它。如果你能帮我解决这个问题,我会非常高兴。 我尝试了grep和regex的一些教程,但我什么都不懂。

2 个答案:

答案 0 :(得分:1)

替换脚本的第18行

page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | tr '[:upper:]' '[:lower:]' | sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' | sort -u`;

有了这个:

page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | sort -u`;

如果您看一下,就可以看到它是怎样的

  1. " "替换为"\n"
  2. 更改案例
  3. 按长度过滤
  4. 排序
  5. 您可以从该管道链中删除位并查看输出如何更改

答案 1 :(得分:0)

从脚本中删除此位:

template

将单独留下案例。

shadowRoot中还有一点只能选择您可以删除的9到25个字符的单词,或者如果您喜欢不同的范围则会更改:

tr '[:upper:]' '[:lower:]' | 

或者您可以尝试更简单的策略:下载并安装命令行Web浏览器w3m,并将wordlist.sh中的复杂行替换为:

`sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' |`

wordlist.sh是(一种奇怪的)从html文件中获取所有文本的方法,然后page=`grep '' -R "./temp/" | w3m -dump wikipedia.org | grep -o '\w\+' | sort -u` 删除所有html标记和其他非显示内容,{{1}匹配任何单词。