根据列值将CSV文件拆分为多个文件

时间:2018-06-19 17:41:08

标签: powershell

我是PowerShell的新手,需要根据列值将CSV文件拆分为多个文件。

我的源文件看起来像这样

 ID   Name   TNumber
 123  Jo     123456
 123  Joe    789012
 124  Tom    896578
 124  Tom    403796

我阅读了this thread,它有助于我进行分组,但是我对如何根据ID列将其拆分为多个文件缺乏了解。有可能吗?

9 个答案:

答案 0 :(得分:0)

这应该可以解决问题:

$fileContent = @(Get-Content -Path 'testfile.csv')

foreach( $line in $fileContent ) {
    $lineToken = ($line -replace '\s+', ' ').Trim() -split ' '
    if( $lineToken[0] -match '^[0-9]+$' ) {
        $line | Out-File -FilePath ($lineToken[0] + '.csv') -Append
    }
}

答案 1 :(得分:0)

您可以找到唯一的ID列表,然后使用Where-Object遍历它们,以将每个ID过滤到单独的文件中。

$csv = Import-CSV $Path
$IDs = $csv.ID | Select-Object -Unique
foreach ($ID in $IDs) {
    $csv | Where-Object {$_.ID -eq $ID} | Export-CSV "C:\example\path\$ID.csv"
}

使用Where-Object并不是特别有效,因为每次您都在搜索整个csv时。您可以使用split内置的where() method(需要PS4 +)将CSV对象替换为一个新对象,该对象先前已过滤掉了值。这样,每次迭代的过滤值都较小。

$csv = Import-CSV $Path
$IDs = $csv.ID | Select-Object -Unique
foreach ($ID in $IDs) {
    $newfile,$csv = $csv.where({$_.ID -eq $ID},'Split')
    $newfile | Export-CSV "C:\example\path\$ID.csv"
}

这假定您显示的源文件是逗号分隔的csv文件的格式化导入。否则,请使用-delimiter的{​​{1}}参数来设置正确的限制器。

答案 2 :(得分:0)

也许我正在使其复杂化,但是以防万一,我假设“名称”列包含中间名。像这样:

{'a': Counter({'I': 2, 'said': 2, 'that': 1}),
 'b': Counter({'she': 1, 'is': 1, 'he': 1, 'was': 1})}

我对这个问题的解决方案如下:

ID     Name     TNumber
123    Jo       123456
123    Joe      789012
124    Tom      896578
124    Tom      403796
125    Jan W.   500300
125    Janny    700200

答案 3 :(得分:0)

如果文件具有制表符分隔符,则可以执行以下操作:

$CurDir="C:\temp"

Import-Csv "$CurDir\test.csv" -Delimiter "`t" | Group ID | %{
    $ID="{0}.csv" -f $_.Name
    $_.Group | export-csv "$CurDir\$ID" -NoType
}

答案 4 :(得分:0)

对不起,我误解了这个问题。重力,感谢您的澄清。我认为其他一些答案可能有用,但是如果没有,您可以尝试一下。这可能就是我会做的。请注意,我假设您有一个制表符分隔的文件,因此使用-delimiter“ t". If it is comma separated, just remove the -delimiter " t”。

$users = import-csv users.csv -delimiter "`t"

# Loop through users.csv
foreach($user in $users)  
{
    # Put each field in a separate variable.
    $id = $user.ID;
    $name = $user.Name;
    $tnumber = $user.TNumber;

    # Write variables to host just to be sure the file is being read properly. This code can be commented out or removed after you are sure the file is being read.
    write-host $id;
    write-host $name;
    write-host $tnumber;
    write-host "";

    # If no file exists for a user with the ID contained in $id on this iteration, create it.
        if(!(Test-Path "$id.csv"))
        {
            out-file -filepath "$id.csv" -inputobject "ID`tName`tTNumber" -append;           
        }

    # Append record for the user with the ID contained in $id on this iteration to $id.csv
        out-file -filepath "$id.csv" -inputobject "$id`t$name`t$tnumber" -append;           
}

pause

答案 5 :(得分:0)

Group-Object的任何列值,此处我们使用ID

$groups = Import-CSV e:\test.csv | Group-Object ID

$groups

输出

Count Name   Group
----- ----   -----
    2 123    {@{ID=123; Name=Jo; Tnumber=123456}, @{ID=123; Name=Joe;Tnumber=324233}}
    2 124    {@{ID=124; Name=Tom; Tnumber=5645645}, @{ID=124; Name=Tom; Tnumber=23423}}

最后将其送入for循环

$groups | ForEach-Object {$_.Group | Export-Csv "$($_.Name).csv" -NoTypeInformation}

答案 6 :(得分:0)

我来这里是为了寻找一个相当简单的过程的快速答案,但是大多数答案似乎与分组或行操作有些复杂。

以下内容非常有效,我觉得更容易理解:

$users = Import-Csv -Path "C:\example\path\users.csv" -Delimiter "`t"

foreach ($user in $users) {
    $user | Export-Csv -Path "C:\example\path\$($user.ID).csv" -Append -NoTypeInformation
}

对于我的特殊情况,我们不需要输出文件中的特定列,因此我使用了Select。在您的情况下,它看起来像:

$users = Import-Csv -Path "C:\example\path\users.csv" -Delimiter "`t"

foreach ($user in $users) {
    $user | Select Name, TNumber | Export-Csv -Path "C:\example\path\$($user.ID).csv"  -Delimiter "`t" -Append -NoTypeInformation
}

答案 7 :(得分:0)

这是一个很老的问题。偶然发现了一个类似的场景,我必须根据文件中特定列的值从单个 csv 文件创建多个 CSV 文件。

我这样创建它是因为对我来说,我必须拆分的列名不是固定的,我有一些 5-6 个场景。

对我来说,这两个值 $InputFilePath$SplitByColumnName 是通过命令行参数传递的。

$InputFilePath = "C:\Test\SourceFile.csv"
$SplitByColumnName = "ColumnName" #Enter ColumnName here on basis of which you want to split.

$data = Import-Csv $InputFilePath | Select -ExpandProperty $SplitByColumnName -Unique

$a = $data | select 

ForEach ($i in $a)
{  
  $FinalFileNamePath = "C:\Test\" + $i + ".CSV" #This is where you would keep the splitted files.

  Import-Csv $InputFilePath | where {$_.$SplitByColumnName -eq $i } | Export-Csv $FinalFileNamePath -NoTypeInformation  
}

答案 8 :(得分:-1)

您写了csv,所以我假设您的文件的纯文本版本如下:

ID,名称,TNumber 123,Jo,123456 123,乔,789012 124,汤姆,896578 124,汤姆,403796

这就是我要做的:

$users = import-csv users.csv

foreach($user in $users)  
{

    $id = $user.ID;
    $name = $user.Name;
    $tnumber = $user.TNumber;

    out-file -filepath id.csv -inputobject $id -append;
    out-file -filepath name.csv -inputobject $name -append;
    out-file -filepath tnumber.csv -inputobject $tnumber -append;

}

如果您没有csv并且它是制表符分隔的文件,则可以在第一行中添加以下属性:

-分隔符“`t”

希望这会有所帮助。