我的控制台应用程序正在从文本文件中读取大量数据,这些数据将保存到数据库中。为此,我将数据存储到DataTable中,并且我想每5分钟将此DataTable转储到DB(如果我想一次转储整个数据,那么我必须用整套数据填充DataTable,在这种情况下,我得到了OutOfMemoryException)。
public void ProcessData()
{
string[] files=File.ReadAllLines(path)
foreach(var item in files)
{
DataRow dtRow= dataTable.NewRow();
dtRow["ID"]= .... //some code here;
dtRow["Name"]= .... //some code here;
dtRow["Age"]= .... //some code here;
var timer = new Timer(v => SaveData(), null, 0, 5*60*1000);
}
}
public void SaveData(string tableName, DataTable dataTable )
{
//Some code Here
//After dumping data to DB, clear DataTable
dataTable.Rows.Clear();
}
我想要的是,代码将继续填充DataTable,并且每5分钟它将调用SaveData()方法。这将继续运行,直到所有文件都已处理完毕。
但是,我已经看到,当调用SaveData()方法时,它正在执行4-5次。有时,它每隔5分钟就会调用一次机器人。
我没有得到如何继续这里。如何解决这个问题?可以在这里使用任何其他方法吗?任何帮助表示赞赏。
答案 0 :(得分:4)
使用ReadAllLines完全读取每个文本文件是否必不可少,这将消耗大量内存。为什么不从文件中读取x行,保存到数据库,然后继续直到文件结束?
答案 1 :(得分:3)
您最大的问题是在您的foreach中实例化新的Timer
个实例。每个foreach调用中的新Timer
对象意味着同时调用SaveData
的多个线程,意味着dataTable
被处理并同时多次保存到数据库,可能(并且可能)在行被清除之前,因此将大部分文件复制到数据库中。
在我提出问题的解决方案之前,我想指出在5分钟的间隔内保存数据会产生明显的代码味道。正如已经指出的那样,我建议一些基于某些数据大小而不是任意时间间隔加载和保存数据的方法。也就是说,我会继续解决你的问题,假设有一个理由你必须以5分钟的间隔保存。
首先,我们需要正确设置Timer
,您会注意到我在foreach循环之外创建。 Timer
继续按间隔运行,而不仅仅是等待并执行一次。
其次,我们必须采取措施确保我们的中间数据存储上的线程安全数据完整性(在您使用DataTable
的情况下,但我使用的是List
自定义类,因为DataTable
对我们想做的事来说太贵了。您会注意到我在更新List
之前locking完成了此操作。
更新数据处理类:
private bool isComplete = false;
private object DataStoreLock = new object();
private List<MyCustomClass> myDataStore;
private Timer myTimer;
public void ProcessData()
{
myTimer = new Timer(SaveData, null, TimeSpan.Zero, TimeSpan.FromMinutes(5.0));
foreach (var item in File.ReadLines(path))
{
var myData = new MyCustomClass()
{
ID = 0, // Some code here
Name = "Some code here",
Age = 0 // Some code here
};
lock (DataStoreLock)
{
myDataStore.Add(myData);
}
}
isComplete = true;
}
public void SaveData(object arg)
{
// Our first step is to check if timed work is done.
if (isComplete)
{
myTimer.Dispose();
myTimer = null;
}
// Our next step is to create a local instance of the data store to work on, which
// allows ProcessData to continue populating while our DB actions are being performed.
List<MyCustomClass> lDataStore;
lock (DataStoreLock)
{
lDataStore = myDataStore;
myDataStore = new List<MyCustomClass>();
}
//Some code DB code here.
}
编辑:我已将枚举更改为ReadLines
而不是ReadAllLines
。阅读ReadLines
method on MSDN下的备注。 ReadAllLines
将成为阻止调用,而ReadLines
将允许在读取文件时处理枚举。我无法想象一个场景,否则你的foreach
将运行超过5分钟,如果该文件已经全部读入内存。
答案 2 :(得分:2)
以下是关于如何实现代码的建议以及其他答案的建议:
public void ProcessData()
{
int i = 1;
foreach(var item in File.ReadLines(path)) //This line has been edited
{
DataRow dtRow= dataTable.NewRow();
dtRow["ID"]= .... //some code here;
dtRow["Name"]= .... //some code here;
dtRow["Age"]= .... //some code here;
if (i%25 == 0) //you can change the 25 here to something else
{
SaveData(/* table name */, /* dataTable */);
}
i++;
}
SaveData(/* table name */, /* dataTable */);
}
public void SaveData(string tableName, DataTable dataTable )
{
//Some code Here
//After dumping data to DB, clear DataTable
dataTable.Rows.Clear();
}