标签: php regex
我有一个非常大的文件 - 有些达到10GB - 主要包含结构化数据(例如,其中99%是我感兴趣的每行文本的制表符分隔值)。我需要从这些文件中提取我可以通过正则表达式轻松找到的非常具体的数据。但是,我担心的是,如果我尝试将文件转换为字符串然后将该字符串转换为正则字符串,那么我将遇到各种各样的问题。
正则表达式解析非常大的文件有什么好的策略?
答案 0 :(得分:5)
逐行读取文件(fgets)并以块的形式处理。