我需要根据电子邮件地址从一个csv(文件a)中删除与另一个csv(文件b)中的字符串匹配或部分匹配的字符串:
文件-a
email,Firstname,Lastname
Peter@hotmail.com,pete,Smith
Paul@gmail.com,paul,
Mary@hotmail.com,,Jones
puff@yahoo.com,puff,Dragon
文件-b
email,Firstname,Lastname
Peter@hotmail.com,,Smith
Mary@hotmail.com,Mary
重复输出文件
email,Firstname,Lastname
Paul@gmail.com,paul,
puff@yahoo.com,puff,Dragon
我在这里遇到了类似的问题:
Removing similar lines from two files
但是,这仅适用于完全匹配,我尝试使用“ notmatch”而不是“ notcontains”,但这不起作用。我对Powershell相当陌生,无法完全确定自己需要做什么。任何帮助将不胜感激。
答案 0 :(得分:0)
我首先Import-Csv
个文件,并使用Compare-Object
限于属性email
## Q:\Test\2019\02\28\SO_54929339.ps1
$fileA = Import-csv '.\file-a.csv'
$fileB = Import-csv '.\file-b.csv'
$deduped = Compare-Object -Ref $fileA -Diff $fileB -Property email -PassThru |
Where-Object Sideindicator -eq '<=' |
Select-Object * -ExcludeProperty Sideindicator
$deduped
$deduped | Export-Csv '.\deduped-output-file.csv' -NoTypeInformation
示例输出:
> Q:\Test\2019\02\28\SO_54929339.ps1
email Firstname Lastname
----- --------- ---------
Paul@gmail.com paul
puff@yahoo.com puff Dragon