标签: regex duplicates textpad
大家好!我对这个问题非常抱歉,但我没有任何正则表达式的经验,我想知道是否有可能做到的事情。
我正在研究从BBC新闻采集的新闻故事集。然而,在我的语料库中重复了一些新闻项目,我想知道是否可以做些什么来突出显示这些重复项而不会整理我的数据。非常感谢你,我为这个可能天真的问题再次道歉。
答案 0 :(得分:0)
通常我会删除重复项并将结果保存在不同的文件中(保持原始文件不变)。然后我比较两个文件(总指挥官,考试差异......)。