使用ruby或python在文件中查找

时间:2009-05-09 03:29:52

标签: python ruby search file grep

一个流行的文本编辑器具有以下“在文件中查找”功能,该功能在对话框中打开:

 Look For:       __searchtext__
 File Filter:    *.txt; *.htm
 Start From:     c:/docs/2009
 Report:         [ ] Filenames [ ]FileCount only
 Method:         [ ] Regex     [ ]Plain Text

事实上,一些流行的文本编辑有这个。

我想做同样的事情,但使用python或ruby类而不是文本编辑器。 这样,可以从任何支持ruby或python的平台上的脚本运行这种类似脑死亡的简单操作。

问题:我不想自己写这个,所以有人知道ruby或python脚本接受相同或类似的简单输入args并做你期望的吗? / p>

我正在寻找能够进行蛮力线性搜索的内容,与索引搜索无关。

2 个答案:

答案 0 :(得分:5)

我知道你说你不想自己写,但是对于它的价值,用os.walk很容易 - 你可以这样做:

results = []
if regex_search:
    p = re.compile(__searchtext__)
for dir, subdirs, subfiles in os.walk('c:/docs/2009'):
    for name in fnmatch.filter(subfiles, '*.txt'):
        fn = os.path.join(dir, name)
        with open(fn, 'r') as f:
            if regex_search:
                results += [(fn,lineno) for lineno, line in enumerate(f) if p.search(line)]
            else:
                results += [(fn,lineno) for lineno, line in enumerate(f) if line.find(__searchtext__) >= 0]

(那是Python,顺便说一句)

答案 1 :(得分:3)

Grepper是David A. Black的Ruby宝石,正是这样做的:

g = Grepper.new
g.files = %w{ one.txt two.txt three.txt }
g.options = %w{ B2 }   # two lines of before-context
g.pattern = /__search_string__/
g.run

g.results.each do |file, result|
  result.matches.each do |lineno, before, line, after|
    etc....

我相信它会将结果发送到grep并将结果包装在Ruby对象中,这意味着它采用与grep相同的选项。安装时:

sudo gem install grepper