以指定格式读取excel中的非结构化数据

时间:2015-08-10 07:08:40

标签: excel etl data-conversion structured-data

我正在尝试将XL中的非结构化数据转换为预定义格式。情况是输入数据将具有许多不同的布局。想象一下以下情况: 您有许多供应商以XL格式发送一批发票,每个发票都有自己的格式,并且不太可能在预定义的布局中进行标准化。您希望从这些布局中“读取”并将它们转换为一个共同的布局,例如:项目代码,描述,数量和零售价格。这些是所有发票可能具有的常见字段,但有些可能会使用例如条形码或唯一代码或产品代码而不是“商品代码”。因此,我正在寻找的解决方案是有一个程序来教它,当它们遇到第2行单元格3中找到的供应商名称X时,它应该查找“项目代码”列,当它们遇到名称为Y的供应商时第10行单元格6他们应该查找列“条形码”等。等等。程序然后将每行上找到的项目代码,描述,数量和零售价格提取到一个公共/标准模板中的新工作表/工作簿中。

我是.NET开发人员,目前我正在做这种类型的逻辑,硬编码,读取这些非结构化数据并将其转换为“标准”方式。我找不到市场上可以“教它”从源读取并将其转换为其他来源的任何软件。你会如何应对这样的挑战?

0 个答案:

没有答案