使用正则表达式删除冗余信息

时间:2013-01-14 16:15:55

标签: regex deduplication

我想将正则表达式(.NET)用于以下任务。

文本文件包含以下行:

=650  \1$aPets$xFiction.  
=650  \1$aApartment houses$xFiction.  
=650  \0$aPets$xFiction.  
=650  \0$aApartment houses$xFiction.

正则表达式应该识别除第8个字符(0对1)之外的行相同的情况,&然后删除第8个字符为1的行。

输出将是:

=650  \0$aPets$xFiction.  
=650  \0$aApartment houses$xFiction.  

(文本文件的其余部分保持不变)

如果其他工具或技术更可取,我很乐意了解这些。

谢谢。

0 个答案:

没有答案