我正在逐行读取excel文件(实际上是逗号分隔的csv文件)列中的数据,此文件由外部实体发送。要读取的列是时间,即00.00格式,因此使用拆分方法读取所有不同的列,但文件有时带有额外的列(元素之间的逗号),因此拆分元素现在总是正确的。下面是用于读取和拆分不同列的代码,这些元素将保存在数据库中。
public void SaveFineDetails()
{
List<string> erroredFines = new List<string>();
try
{
log.Debug("Start : SaveFineDetails() - Saving Downloaded files fines..");
if (!this.FileLines.Any())
{
log.Info(string.Format("End : SaveFineDetails() - DataFile was Empty"));
return;
}
using (RAC_TrafficFinesContext db = new RAC_TrafficFinesContext())
{
this.FileLines.RemoveAt(0);
this.FileLines.RemoveAt(FileLines.Count - 1);
int itemCnt = 0;
int errorCnt = 0;
int duplicateCnt = 0;
int count = 0;
foreach (var line in this.FileLines)
{
count++;
log.DebugFormat("Inserting {0} of {1} Fines..", count.ToString(), FileLines.Count.ToString());
string[] bits = line.Split(',');
int bitsLength = bits.Length;
if (bitsLength == 9)
{
string fineNumber = bits[0].Trim();
string vehicleRegistration = bits[1];
string offenceDateString = bits[2];
string offenceTimeString = bits[3];
int trafficDepartmentId = this.TrafficDepartments.Where(tf => tf.DepartmentName.Trim().Equals(bits[4], StringComparison.InvariantCultureIgnoreCase)).Select(tf => tf.DepartmentID).FirstOrDefault();
string proxy = bits[5];
decimal fineAmount = GetFineAmount(bits[6]);
DateTime fineCreatedDate = DateTime.Now;
DateTime offenceDate = GetOffenceDate(offenceDateString, offenceTimeString);
string username = Constants.CancomFTPServiceUser;
bool isAartoFine = bits[7] == "1" ? true : false;
string fineStatus = "Sent";
try
{
var dupCheck = db.GetTrafficFineByNumber(fineNumber);
if (dupCheck != null)
{
duplicateCnt++;
string ExportFileName = (base.FileName == null) ? string.Empty : base.FileName;
DateTime FileDate = DateTime.Now;
db.CreateDuplicateFine(ExportFileName, FileDate, fineNumber);
}
else
{
var adminFee = db.GetAdminFee();
db.UploadFTPFineData(fineNumber, fineAmount, vehicleRegistration, offenceDate, offenceDateString, offenceTimeString, trafficDepartmentId, proxy, false, "Imported", username, adminFee, isAartoFine, dupCheck != null, fineStatus);
}
itemCnt++;
}
catch
{
errorCnt++;
}
}
else
{
erroredFines.Add(line);
continue;
}
}
现在问题是,这个文件并不总是带有我们期望的9个元素,例如在这个图像上,线条不一样(忽略第一行,它的标题)Gremlin Console
在第一行 FM 应该是 36DXGP 的一部分,而不是两个分开的元素。这意味着列现在是额外的。现在这将我们带到手头的问题,这是时间元素,因为额外的昏迷,时间现在是别的,现在读作 20161216 ,所以时间元素上的拆分不是工作在一起。所以我做的是,读取不正确的行,检查其长度,如果长度不是9,则将其添加到错误列表并继续。
但我的继续关键词似乎不起作用,它进入了else部分,然后返回读取相同的错误行。
我已经检查了Start上的答案,并且他们提供了关于如何继续工作的良好示例,我介绍了其他因为此示例中的格式对我不起作用(其他方面也没有任何区别)。以下是示例数据
注意要读取的第一行以96开头
H,1789,,,,,,,,
96/17259/801/035415,FM,36DXGP,20161216,17.39,city hall-cape town,Makofane,200,0,0
MA/80/034808/730,CA230721,20170117,17.43,malmesbury,PATEL,200,0,0,
我在这里做错了什么
答案 0 :(得分:0)
我找到了解决问题的方法,由于导致空元素的尾随逗号,行的长度存在问题,然后我用这个代码去除了这个空元素并确定了新的长度
bits = bits.Where(x => !string.IsNullOrEmpty(x)).ToArray();
int length = bits.Length
一切都很好
答案 1 :(得分:0)
我建议您出于性能和可读性原因使用以下重载:
line.Split(new char[] {','}, StringSplitOptions.RemoveEmptyEntries)l