在两个regexen之间获取随机文本

时间:2011-04-08 12:27:35

标签: regex bash random

我有一个抓帖子的文件,如下所示:

1 Name: foo

Hello, my name is foo.

2 Name: bar

Hello.
Multi
line
post.

3 Name: foo

Hello, bar!

我能够编写一个只与标题匹配的正则表达式(因为它们有一些在帖子中不允许的HTML)。

如何从此文件中获取随机帖子?只是文字,没有名字等。

编辑:请注意,某些帖子号码可能会丢失。

1 个答案:

答案 0 :(得分:0)

如果你有Ruby(1.9 +)

$ ruby -0777 -ne 'a=$_.split(/\d+\sName:.*/);puts a.reject(&:empty?).shuffle.first' file


Hello, my name is foo.

$ ruby -0777 -ne 'a=$_.split(/\d+\sName:.*/);puts a.reject(&:empty?).shuffle.first' file


Hello, bar!