如何定位&识别多个文件中的相同部分?

时间:2015-12-22 21:31:59

标签: regex bash diff matching

我有大约30个文件(降价,但大部分都在这一点之外),有些文件是通过复制/粘贴其他文件中的部分创建的,因此有很多重复。我想将重复的部分删除到外部"模块"文件,以便我可以编辑SectionA.md中的A部分,然后包含在需要该部分的每个文件中。

我想:

  1. 忽略少于4行的相同部分
  2. 每个重复部分的全文
  3. 出现该部分的文件的名称
  4. 我怎样才能做到这一点?

    注意:该过程不需要100%自动化& 100%完美。如果有快速解决方案可以转储所有比赛&文件名&我必须手工排序,这很好。这是一次性任务,因此权宜之计胜过健壮性

    当前的想法

    • 我正在考虑使用diff因为我知道它可以识别文件的相同部分,但我不确定如何将其映射到30个文件
    • 我可以编写一个程序来执行此操作(在Node中只是因为这是我熟悉的),但这可能比手动通过所有30个文件花费更多时间,所以我不赞成这个溶液

0 个答案:

没有答案