如何在c#中读取excel文件而不丢失任何列?

时间:2009-02-20 19:56:59

标签: c# .net excel

我一直在使用OleDb连接成功读取excel文件已有一段时间了,但我遇到了一个问题。我有一个人试图上传第一列中没有任何内容的Excel电子表格,当我尝试读取该文件时,它无法识别该列。

我目前正在使用以下OleDb连接字符串:

提供商= Microsoft.Jet.OLEDB.4.0;
数据源= c:\ test.xls;
扩展属性=“Excel 8.0; IMEX = 1;”

因此,如果excel文件中有13列,那么我回来的OleDbDataReader只有12列/字段。

任何见解都将受到赞赏。

6 个答案:

答案 0 :(得分:3)

SpreadsheetGear for .NET为您提供了一个用于处理.NET中的xls和xlsx工作簿的API。它比OleDB或Excel COM对象模型更容易使用和更快。您可以查看live samples或使用free trial自行尝试。

免责声明:我拥有SpreadsheetGear LLC

编辑:

StingyJack评论说“比OleDb更快?更好地支持声称”。

这是一个合理的要求。我一直认为声称事实是虚假的,所以我不能因为持怀疑态度而责怪任何人。

下面是使用SpreadsheetGear创建50,000行10列工作簿的代码,将其保存到磁盘,然后使用OleDb和SpreadsheetGear对数字求和。 SpreadsheetGear在0.31秒内读取500K单元,而使用OleDB则读取0.63秒 - 仅快两倍。 SpreadsheetGear实际上创建和读取工作簿的时间比用OleDB读取工作簿的时间短。

代码如下。您可以使用SpreadsheetGear免费试用版自己尝试。

using System;
using System.Data; 
using System.Data.OleDb; 
using SpreadsheetGear;
using SpreadsheetGear.Advanced.Cells;
using System.Diagnostics;

namespace SpreadsheetGearAndOleDBBenchmark
{
    class Program
    {
        static void Main(string[] args)
        {
            // Warm up (get the code JITed).
            BM(10, 10);

            // Do it for real.
            BM(50000, 10);
        }

        static void BM(int rows, int cols)
        {
            // Compare the performance of OleDB to SpreadsheetGear for reading
            // workbooks. We sum numbers just to have something to do.
            //
            // Run on Windows Vista 32 bit, Visual Studio 2008, Release Build,
            // Run Without Debugger:
            //  Create time: 0.25 seconds
            //  OleDb Time: 0.63 seconds
            //  SpreadsheetGear Time: 0.31 seconds
            //
            // SpreadsheetGear is more than twice as fast at reading. Furthermore,
            // SpreadsheetGear can create the file and read it faster than OleDB
            // can just read it.
            string filename = @"C:\tmp\SpreadsheetGearOleDbBenchmark.xls";
            Console.WriteLine("\nCreating {0} rows x {1} columns", rows, cols);
            Stopwatch timer = Stopwatch.StartNew();
            double createSum = CreateWorkbook(filename, rows, cols);
            double createTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("Create sum of {0} took {1} seconds.", createSum, createTime);
            timer = Stopwatch.StartNew();
            double oleDbSum = ReadWithOleDB(filename);
            double oleDbTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("OleDb sum of {0} took {1} seconds.", oleDbSum, oleDbTime);
            timer = Stopwatch.StartNew();
            double spreadsheetGearSum = ReadWithSpreadsheetGear(filename);
            double spreadsheetGearTime = timer.Elapsed.TotalSeconds;
            Console.WriteLine("SpreadsheetGear sum of {0} took {1} seconds.", spreadsheetGearSum, spreadsheetGearTime);
        }

        static double CreateWorkbook(string filename, int rows, int cols)
        {
            IWorkbook workbook = Factory.GetWorkbook();
            IWorksheet worksheet = workbook.Worksheets[0];
            IValues values = (IValues)worksheet;
            double sum = 0.0;
            Random rand = new Random();
            // Put labels in the first row.
            foreach (IRange cell in worksheet.Cells[0, 0, 0, cols - 1])
                cell.Value = "Cell-" + cell.Address;
            // Using IRange and foreach be less code, 
            // but we'll do it the fast way.
            for (int row = 1; row <= rows; row++)
            {
                for (int col = 0; col < cols; col++)
                {
                    double number = rand.NextDouble();
                    sum += number;
                    values.SetNumber(row, col, number);
                }
            }
            workbook.SaveAs(filename, FileFormat.Excel8);
            return sum;
        }

        static double ReadWithSpreadsheetGear(string filename)
        {
            IWorkbook workbook = Factory.GetWorkbook(filename);
            IWorksheet worksheet = workbook.Worksheets[0];
            IValues values = (IValues)worksheet;
            IRange usedRahge = worksheet.UsedRange;
            int rowCount = usedRahge.RowCount;
            int colCount = usedRahge.ColumnCount;
            double sum = 0.0;
            // We could use foreach (IRange cell in usedRange) for cleaner 
            // code, but this is faster.
            for (int row = 1; row <= rowCount; row++)
            {
                for (int col = 0; col < colCount; col++)
                {
                    IValue value = values[row, col];
                    if (value != null && value.Type == SpreadsheetGear.Advanced.Cells.ValueType.Number)
                        sum += value.Number;
                }
            }
            return sum;
        }

        static double ReadWithOleDB(string filename)
        {
            String connectionString =  
                "Provider=Microsoft.Jet.OLEDB.4.0;" + 
                "Data Source=" + filename + ";" + 
                "Extended Properties=Excel 8.0;"; 
            OleDbConnection connection = new OleDbConnection(connectionString); 
            connection.Open(); 
            OleDbCommand selectCommand =new OleDbCommand("SELECT * FROM [Sheet1$]", connection); 
            OleDbDataAdapter dataAdapter = new OleDbDataAdapter(); 
            dataAdapter.SelectCommand = selectCommand; 
            DataSet dataSet = new DataSet(); 
            dataAdapter.Fill(dataSet); 
            connection.Close(); 
            double sum = 0.0;
            // We'll make some assumptions for brevity of the code.
            DataTable dataTable = dataSet.Tables[0];
            int cols = dataTable.Columns.Count;
            foreach (DataRow row in dataTable.Rows)
            {
                for (int i = 0; i < cols; i++)
                {
                    object val = row[i];
                    if (val is double)
                        sum += (double)val;
                }
            }
            return sum;
        }
    }
}

答案 1 :(得分:1)

我们总是使用Excel Interop打开电子表格并直接解析(例如类似于在VBA中扫描单元格的方式),或者我们创建锁定模板,在用户保存数据之前强制执行某些列

答案 2 :(得分:1)

您可以查看ExcelMapper。它是一个将excel文件作为强类型对象读取的工具。它隐藏了从代码中读取excel的所有细节。如果您的Excel缺少列或列中缺少数据,则需要注意。您阅读了您感兴趣的数据。您可以从http://code.google.com/p/excelmapper/获取ExcelMapper的代码/可执行文件。

答案 3 :(得分:0)

如果可能要求Excel工作表的格式具有列标题,那么您将始终拥有13列。您只需要在处理时跳过标题行。

这也可以纠正用户按照您不期望的顺序放置列的情况。 (检测标题行中的列索引并正确读取)

我看到其他人推荐Excel互操作,但是jeez与OleDb方式相比是一个缓慢的选择。此外,它需要在服务器上安装Excel或OWC(许可)。

答案 4 :(得分:0)

您可以尝试使用Excel和COM。这样,你就可以直接从马的口中获取信息了。

来自D. Anand在MSDN论坛上:

在项目中创建Excel对象库的引用。可以在添加引用对话框的COM选项卡中添加excel对象库。

以下是C#中Excel对象模型的一些信息 http://msdn.microsoft.com/en-us/library/aa168292(office.11).aspx

答案 5 :(得分:0)

我建议您尝试使用Visual Studio Tools for Office和Excel Interop!它的使用非常简单。