我一直在使用OleDb连接成功读取excel文件已有一段时间了,但我遇到了一个问题。我有一个人试图上传第一列中没有任何内容的Excel电子表格,当我尝试读取该文件时,它无法识别该列。
我目前正在使用以下OleDb连接字符串:
提供商= Microsoft.Jet.OLEDB.4.0;
数据源= c:\ test.xls;
扩展属性=“Excel 8.0; IMEX = 1;”
因此,如果excel文件中有13列,那么我回来的OleDbDataReader只有12列/字段。
任何见解都将受到赞赏。
答案 0 :(得分:3)
SpreadsheetGear for .NET为您提供了一个用于处理.NET中的xls和xlsx工作簿的API。它比OleDB或Excel COM对象模型更容易使用和更快。您可以查看live samples或使用free trial自行尝试。
免责声明:我拥有SpreadsheetGear LLC
编辑:
StingyJack评论说“比OleDb更快?更好地支持声称”。
这是一个合理的要求。我一直认为声称事实是虚假的,所以我不能因为持怀疑态度而责怪任何人。
下面是使用SpreadsheetGear创建50,000行10列工作簿的代码,将其保存到磁盘,然后使用OleDb和SpreadsheetGear对数字求和。 SpreadsheetGear在0.31秒内读取500K单元,而使用OleDB则读取0.63秒 - 仅快两倍。 SpreadsheetGear实际上创建和读取工作簿的时间比用OleDB读取工作簿的时间短。
代码如下。您可以使用SpreadsheetGear免费试用版自己尝试。
using System;
using System.Data;
using System.Data.OleDb;
using SpreadsheetGear;
using SpreadsheetGear.Advanced.Cells;
using System.Diagnostics;
namespace SpreadsheetGearAndOleDBBenchmark
{
class Program
{
static void Main(string[] args)
{
// Warm up (get the code JITed).
BM(10, 10);
// Do it for real.
BM(50000, 10);
}
static void BM(int rows, int cols)
{
// Compare the performance of OleDB to SpreadsheetGear for reading
// workbooks. We sum numbers just to have something to do.
//
// Run on Windows Vista 32 bit, Visual Studio 2008, Release Build,
// Run Without Debugger:
// Create time: 0.25 seconds
// OleDb Time: 0.63 seconds
// SpreadsheetGear Time: 0.31 seconds
//
// SpreadsheetGear is more than twice as fast at reading. Furthermore,
// SpreadsheetGear can create the file and read it faster than OleDB
// can just read it.
string filename = @"C:\tmp\SpreadsheetGearOleDbBenchmark.xls";
Console.WriteLine("\nCreating {0} rows x {1} columns", rows, cols);
Stopwatch timer = Stopwatch.StartNew();
double createSum = CreateWorkbook(filename, rows, cols);
double createTime = timer.Elapsed.TotalSeconds;
Console.WriteLine("Create sum of {0} took {1} seconds.", createSum, createTime);
timer = Stopwatch.StartNew();
double oleDbSum = ReadWithOleDB(filename);
double oleDbTime = timer.Elapsed.TotalSeconds;
Console.WriteLine("OleDb sum of {0} took {1} seconds.", oleDbSum, oleDbTime);
timer = Stopwatch.StartNew();
double spreadsheetGearSum = ReadWithSpreadsheetGear(filename);
double spreadsheetGearTime = timer.Elapsed.TotalSeconds;
Console.WriteLine("SpreadsheetGear sum of {0} took {1} seconds.", spreadsheetGearSum, spreadsheetGearTime);
}
static double CreateWorkbook(string filename, int rows, int cols)
{
IWorkbook workbook = Factory.GetWorkbook();
IWorksheet worksheet = workbook.Worksheets[0];
IValues values = (IValues)worksheet;
double sum = 0.0;
Random rand = new Random();
// Put labels in the first row.
foreach (IRange cell in worksheet.Cells[0, 0, 0, cols - 1])
cell.Value = "Cell-" + cell.Address;
// Using IRange and foreach be less code,
// but we'll do it the fast way.
for (int row = 1; row <= rows; row++)
{
for (int col = 0; col < cols; col++)
{
double number = rand.NextDouble();
sum += number;
values.SetNumber(row, col, number);
}
}
workbook.SaveAs(filename, FileFormat.Excel8);
return sum;
}
static double ReadWithSpreadsheetGear(string filename)
{
IWorkbook workbook = Factory.GetWorkbook(filename);
IWorksheet worksheet = workbook.Worksheets[0];
IValues values = (IValues)worksheet;
IRange usedRahge = worksheet.UsedRange;
int rowCount = usedRahge.RowCount;
int colCount = usedRahge.ColumnCount;
double sum = 0.0;
// We could use foreach (IRange cell in usedRange) for cleaner
// code, but this is faster.
for (int row = 1; row <= rowCount; row++)
{
for (int col = 0; col < colCount; col++)
{
IValue value = values[row, col];
if (value != null && value.Type == SpreadsheetGear.Advanced.Cells.ValueType.Number)
sum += value.Number;
}
}
return sum;
}
static double ReadWithOleDB(string filename)
{
String connectionString =
"Provider=Microsoft.Jet.OLEDB.4.0;" +
"Data Source=" + filename + ";" +
"Extended Properties=Excel 8.0;";
OleDbConnection connection = new OleDbConnection(connectionString);
connection.Open();
OleDbCommand selectCommand =new OleDbCommand("SELECT * FROM [Sheet1$]", connection);
OleDbDataAdapter dataAdapter = new OleDbDataAdapter();
dataAdapter.SelectCommand = selectCommand;
DataSet dataSet = new DataSet();
dataAdapter.Fill(dataSet);
connection.Close();
double sum = 0.0;
// We'll make some assumptions for brevity of the code.
DataTable dataTable = dataSet.Tables[0];
int cols = dataTable.Columns.Count;
foreach (DataRow row in dataTable.Rows)
{
for (int i = 0; i < cols; i++)
{
object val = row[i];
if (val is double)
sum += (double)val;
}
}
return sum;
}
}
}
答案 1 :(得分:1)
我们总是使用Excel Interop打开电子表格并直接解析(例如类似于在VBA中扫描单元格的方式),或者我们创建锁定模板,在用户保存数据之前强制执行某些列
答案 2 :(得分:1)
您可以查看ExcelMapper。它是一个将excel文件作为强类型对象读取的工具。它隐藏了从代码中读取excel的所有细节。如果您的Excel缺少列或列中缺少数据,则需要注意。您阅读了您感兴趣的数据。您可以从http://code.google.com/p/excelmapper/获取ExcelMapper的代码/可执行文件。
答案 3 :(得分:0)
如果可能要求Excel工作表的格式具有列标题,那么您将始终拥有13列。您只需要在处理时跳过标题行。
这也可以纠正用户按照您不期望的顺序放置列的情况。 (检测标题行中的列索引并正确读取)
我看到其他人推荐Excel互操作,但是jeez与OleDb方式相比是一个缓慢的选择。此外,它需要在服务器上安装Excel或OWC(许可)。
答案 4 :(得分:0)
您可以尝试使用Excel和COM。这样,你就可以直接从马的口中获取信息了。
来自D. Anand在MSDN论坛上:
在项目中创建Excel对象库的引用。可以在添加引用对话框的COM选项卡中添加excel对象库。
以下是C#中Excel对象模型的一些信息 http://msdn.microsoft.com/en-us/library/aa168292(office.11).aspx
答案 5 :(得分:0)
我建议您尝试使用Visual Studio Tools for Office和Excel Interop!它的使用非常简单。