目前,我正在从包含以下任何内容的文件中搜集数据:
342163477\|405760044\|149007683\|322391022\|77409125\|195978682\|358463993\|397650460\|171780277\|336063797\|397650502\|357636118\|168490006...............
此列表较长,包含约700个不同的值。
提取它的最有效方法是什么?我可以在10/20/50/100的部分内容进行切割......还是有其他unix方法?这个grep通过管道传输到python进行进一步分析,速度足够快。
答案 0 :(得分:0)
拆分它只会让情况变得更糟。除了退化情况之外没有关系,这不是,正则表达式有多长或多复杂:执行时间是相同的。