我正在处理R中的大文件,我只需要特定正则表达式的第一个匹配项,但grep
正在进一步处理,这当然需要时间。
有没有办法让它在第一场比赛后停止?
编辑:似乎它不是grep而是readLines这很慢。读取120MB文件需要花费20秒......地球上的数据如何可以从data.table中读取< 2s以及如何快速执行
答案 0 :(得分:0)
根据regular-expressions.info (see first paragraph)最新版本的 R 应该支持正则表达式子程序,它可以有量词,所以在你的情况下你应该能够做到以下几点:
(your-regex)(?1){1}