我是LINQ的新手,我想学习它在解析文本文件时的用处,而不是使用像Perl或Ruby这样的脚本语言。我已经生成了一个由“CR”和“LF”分隔的长列表,我想创建一个.CSV文件导出到只包含前三行的Excel。例如:
[CR][LF]
Field: Microsoft.VSTS.Build.FoundIn[CR][LF]
Name: Found In[CR][LF]
Type: String[CR][LF]
Use: Test project[CR][LF]
Indexed: False[CR][LF]
Reportable As: dimension[CR][LF]
Synchronizes Identity Name Changes: False[CR][LF]
[CR][LF]
Field: Microsoft.VSTS.Build.IntegrationBuild[CR][LF]
Name: Integration Build[CR][LF]
Type: String[CR][LF]
Use: Test project[CR][LF]
Indexed: False[CR][LF]
Reportable As: dimension[CR][LF]
Synchronizes Identity Name Changes: False[CR][LF]
[CR][LF]
(列表继续)
期望的输出:
"Microsoft.VSTS.Build.FoundIn","Found In","String"
"Microsoft.VSTS.Build.IntegrationBuild","Integration Build","String"
如何以最简单的方式在LINQ中编写它?
答案 0 :(得分:4)
你只是在空白行之间打破“部分”。只需通过将所有内容放入单独缓冲区的行,直到找到空白行。执行此操作时,处理缓冲区中的项目,清除它并重复。你不能真正用纯粹的LINQ 或优雅地做到这一点,所以不要试图强迫它进入它。
var buffer = new List<string>();
foreach (var line in File.ReadLines(pathToFile))
{
if (String.IsNullOrWhitespace(line))
{
ProcessSection(outputFile, buffer);
buffer.Clear(); // or create a new one
}
else
{
buffer.Add(line);
}
}
static void ProcessSection(StreamWriter outputFile, List<string> buffer)
{
if (buffer.Count == 0) return;
var contents = buffer.Take(3)
.Select(line => String.Format("\"{0}\"", line.Substring(line.IndexOf(": ") + 2)));
outputFile.WriteLine(String.Join(",", contents));
}