我有一个抓帖子的文件,如下所示:
1 Name: foo
Hello, my name is foo.
2 Name: bar
Hello.
Multi
line
post.
3 Name: foo
Hello, bar!
我能够编写一个只与标题匹配的正则表达式(因为它们有一些在帖子中不允许的HTML)。
如何从此文件中获取随机帖子?只是文字,没有名字等。
编辑:请注意,某些帖子号码可能会丢失。
答案 0 :(得分:0)
如果你有Ruby(1.9 +)
$ ruby -0777 -ne 'a=$_.split(/\d+\sName:.*/);puts a.reject(&:empty?).shuffle.first' file
Hello, my name is foo.
$ ruby -0777 -ne 'a=$_.split(/\d+\sName:.*/);puts a.reject(&:empty?).shuffle.first' file
Hello, bar!