如何使用剪贴板将数据从Excel工作表复制到DataTable?

时间:2017-05-04 21:53:23

标签: c# excel datatable clipboard xmldocument

我有一个在Microsoft Framework 3.5上创建的Winform项目。 用户可能已安装Windows 7或Windows XP以及Office 2007或更高版本。

我正在编写一个程序来获取剪贴板数据并输入C#DataTable。 我已经创建了一种从剪贴板获取原始数据并将其上传到DataTable的方法。

但在某些情况下,Excel数据会显示一个值,但内部会有另一个值:

enter image description here

我正在研究从Excel获取原始数据的方法:

string XmlFmt = "XML Spreadsheet";
var clipboard = Clipboard.GetDataObject();

if (clipboard.GetDataPresent(XmlFmt))
{
    var clipData = clipboard.GetData(XmlFmt);
    StreamReader streamReader = new StreamReader((MemoryStream)clipData);
    streamReader.BaseStream.SetLength(streamReader.BaseStream.Length - 1);

    string xmlText = streamReader.ReadToEnd();
    var stream = new StringReader(xmlText);

    XmlDocument xmlDocument = new XmlDocument();
    xmlDocument.LoadXml(xmlText);

    DataSet dsExcelData = new DataSet();
    dsExcelData.ReadXml(new XmlNodeReader(xmlDocument));
}

但是,这个方法检索了一个带有多个表的DataSet,其中包含Excel Data的每个部分的配置: enter image description here enter image description here

基本上,我想将这些结构转换为仅包含原始数据的简单DataTable。 有人可以帮我提一下如何实现这个目标吗? ...我不想在此实现中使用第三方库。

3 个答案:

答案 0 :(得分:2)

如果它们是平面数据,你可以这样做。

private class Field
{
        public string Valor { get; set; }
}

private class Row
{
        public List<Field> Fields { get; set; }

        public Row(string value)
        {
            Fields = new List<Field>();
            var fieldsString = value.Split(new char[] {'\t'});
            foreach (string f in fieldsString)
            {
                Fields.Add(new Field {Valor = f});
            }
    }
}

public Parse()
{
    var data = Clipboard.GetDataObject();
    var datos = (string)data.GetData(DataFormats.Text);
    var stringRows = datos.Split(new Char[] {'\r', '\n'}, StringSplitOptions.RemoveEmptyEntries);
    var table = new List<Row>(stringRows.Length) ;
    foreach (string stringRow in stringRows)
    {
        table.Add( new Row(stringRow) );
    }
}

答案 1 :(得分:2)

我找到了一个干净且防弹的解决方案。代码如下:

首先,将XmlDocument转换为XElement的扩展名:

/// <summary> Convert XML Document to XDocument </summary>
/// <param name="xmlDocument">Attached XML Document</param>
public static XDocument fwToXDocument(this XmlDocument xmlDocument)
{
    using (XmlNodeReader xmlNodeReader = new XmlNodeReader(xmlDocument))
    {
        xmlNodeReader.MoveToContent();
        return XDocument.Load(xmlNodeReader);
    }
}

完整的功能:

private DataTable clipboardExcelToDataTable(bool blnFirstRowHasHeader = false)
{
    string strTime = "S " + DateTime.Now.ToString("mm:ss:fff");
    var clipboard = Clipboard.GetDataObject();
    if (!clipboard.GetDataPresent("XML Spreadsheet")) return null;

    strTime += "\r\nRead " + DateTime.Now.ToString("mm:ss:fff");
    StreamReader streamReader = new StreamReader((MemoryStream)clipboard.GetData("XML Spreadsheet"));
    strTime += "\r\nFinish read " + DateTime.Now.ToString("mm:ss:fff");
    streamReader.BaseStream.SetLength(streamReader.BaseStream.Length - 1);

    XmlDocument xmlDocument = new XmlDocument();
    xmlDocument.LoadXml(streamReader.ReadToEnd());
    strTime += "\r\nRead XML Document " + DateTime.Now.ToString("mm:ss:fff");

    XNamespace ssNs = "urn:schemas-microsoft-com:office:spreadsheet";
    DataTable dtData = new DataTable();

    var linqRows = xmlDocument.fwToXDocument().Descendants(ssNs + "Row").ToList<XElement>();

    for (int x = 0; x < linqRows.Max(a => a.Descendants(ssNs + "Cell").Count()); x++)
        dtData.Columns.Add("Column " + (x + 1).ToString());

    int intCol = 0;

    DataRow drCurrent;

    linqRows.ForEach(rowElement =>
        {
            intCol = 0;
            drCurrent = dtData.Rows.Add();
            rowElement.Descendants(ssNs + "Cell")
                .ToList<XElement>()
                .ForEach(cell => drCurrent[intCol++] = cell.Value);
        });

    if (blnFirstRowHasHeader)
    {
        int x = 0;
        foreach (DataColumn dcCurrent in dtData.Columns)
            dcCurrent.ColumnName = dtData.Rows[0][x++].ToString();

        dtData.Rows.RemoveAt(0);
    }

    strTime += "\r\nF " + DateTime.Now.ToString("mm:ss:fff");

    return dtData;
}

这个过程需要大约15秒才能读取~25,000行。

适用于任何类型的数据。 基本上,该方法创建一个具有与Excel WorkSheet相同结构的网格。 行或列的合并将填充第一个单元格。 默认情况下,所有列都将是字符串DataType。

答案 2 :(得分:0)

  

在某些情况下,Excel数据会显示一个值,但内部会有另一个值。

使用XML方法是多个数据表的内部结构的原因。请尝试使用此方法:

self.labelCorrection.backgroundColor = UIColor.clear
self.labelCorrection.layer.backgroundColor = UIColor.white.cgColor

参考:http://www.seesharpdot.net/?p=221

修改

我已经完成了一些测试,甚至使用“XML Spreadsheet”剪贴板格式,数据可以以指数表示法存储:

enter image description here

您可以检测并转换这些数字:Parse a Number from Exponential Notation