我正在尝试在Azure数据工厂数据集中读取具有.xlsx扩展名的Azure Blob存储中的文件并使其表现出色。会引发以下错误
Error found when processing 'Csv/Tsv Format Text' source 'Filename.xlsx' with row number 3: found more columns than expected column count: 1.
在Azure Data Factory中要读取的Excel文件,正确的列和行分隔符是什么
答案 0 :(得分:5)
Excel文件具有专有格式,不是简单的定界文件。如here所示,Azure数据工厂没有没有可以直接导入Excel文件,例如,您不能创建到Excel文件的链接服务并读取它容易。您可以选择的是:
让我们知道您的生活
答案 1 :(得分:0)
Azure Data Factory没有直接上传excel的选项,但是,可以通过某些配置通过链接服务上传。请按照以下步骤操作:
答案 2 :(得分:0)
我想详细说明选项3。SSIS软件包。我测试了解决方案,它确实起作用了。首先-SSIS IR非常昂贵,您可以在不需要时使用http post's to start-stop。
第二,SSIS不支持开箱即用地处理Blob文件。有一些解决方法。您可以使用一些第三方软件(没有尝试过),或者使用explore options
在我的情况下,我使用技巧来部署在本地下载文件的程序包,处理然后删除它。由于SSIS IR是VM,因此部署后基本上在IR上也做同样的事情。这是一个技巧而不是解决方案,并且不是100%稳定的。另一个问题-数字字段在处理过程中出现了一些微不足道的错误-例如。在数据库站点上载25导致25.0000000001。不知道为什么。我没有足够的时间来更深入地研究问题。
答案 3 :(得分:0)
Azure Data Factory V2最近发布了一个更新,以支持在现有连接器上解析Excel(.xls)文件。
当前,支持excel文件的连接为:
更多详细信息请参见:https://docs.microsoft.com/en-us/azure/data-factory/format-excel