我正在寻找我的问题的答案,但我找不到满足我需要的解决方案。
我有一个大文本文件(4GB),它是来自代理的access.log文件。
我还有另一个包含7000行的文件,其中包含一些域名地址或部分网址,可以在我的日志文件中搜索。
问题是要在日志文件中搜索我的7000个术语,花了很长时间。
我想用多线程或其他东西减少这段时间。
但我以前从未编写过这样的东西: - /
你可以帮助我开始吗?提前致谢!
答案 0 :(得分:1)
从概念上讲(不是Perl特有的),我会选择这样的东西:
优点:
此外,尝试使每个线程保持自己的匹配,并且不要将它们同步到同一位置 - 这可能会创建竞争条件。如果需要同步线程,请在上面的步骤(4)和(5)之间进行。
不幸的是,我的Perl非常生疏,但在你得到一个更好的答案之前我会发布这个,希望它会有用。