使用另一个csv从csv中删除类似的字符串

时间:2019-02-28 15:41:07

标签: powershell csv string-comparison

我需要根据电子邮件地址从一个csv(文件a)中删除与另一个csv(文件b)中的字符串匹配或部分匹配的字符串:

文件-a

email,Firstname,Lastname 
Peter@hotmail.com,pete,Smith
Paul@gmail.com,paul,
Mary@hotmail.com,,Jones
puff@yahoo.com,puff,Dragon

文件-b

email,Firstname,Lastname
Peter@hotmail.com,,Smith
Mary@hotmail.com,Mary

重复输出文件

email,Firstname,Lastname 
Paul@gmail.com,paul,
puff@yahoo.com,puff,Dragon

我在这里遇到了类似的问题:

Removing similar lines from two files

但是,这仅适用于完全匹配,我尝试使用“ notmatch”而不是“ notcontains”,但这不起作用。我对Powershell相当陌生,无法完全确定自己需要做什么。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

我首先Import-Csv个文件,并使用Compare-Object限于属性email

## Q:\Test\2019\02\28\SO_54929339.ps1

$fileA = Import-csv '.\file-a.csv'
$fileB = Import-csv '.\file-b.csv'

$deduped = Compare-Object -Ref $fileA -Diff $fileB -Property email -PassThru | 
  Where-Object Sideindicator -eq '<=' | 
    Select-Object * -ExcludeProperty Sideindicator

$deduped 
$deduped | Export-Csv '.\deduped-output-file.csv' -NoTypeInformation

示例输出:

> Q:\Test\2019\02\28\SO_54929339.ps1

email          Firstname Lastname
-----          --------- ---------
Paul@gmail.com paul
puff@yahoo.com puff      Dragon