我有一个政府文档的XML文件和它引用的XSD文件。我正在尝试从XML(化学名称,UN和危险分类)中提取信息并将其存储到SQL Server 2014中的表中。但是,每当我使用XML源执行带有XML源的ETL时,我都会收到错误:The XML Source Adapter does not support mixed content model on Complex Types
。我该如何解决这个问题?我想到并试图更好地理解的一些想法是:在XML上使用XSLT转换仅保留相关信息或使用C#和XPath仅选择我想要的节点。但这已经变成了比我原先想象的更难的东西。任何帮助或方向表示赞赏。
http://www.gpo.gov/fdsys/bulkdata/CFR/2014/title-49/CFR-2014-title49-vol2.xml http://www.gpo.gov/fdsys/bulkdata/CFR/resources/CFRMergedXML.xsd
答案 0 :(得分:1)
试试这个
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Xml;
using System.Xml.Linq;
namespace ConsoleApplication1
{
class Program
{
const string FILENAME = @"c:\temp\CFR-2014-title49-vol2.xml";
static void Main(string[] args)
{
XDocument doc = XDocument.Load(FILENAME);
XElement chapter = doc.Descendants("GPOTABLE").Where(x => x.Element("TTITLE") != null && x.Element("TTITLE").Value == "§ 172.101 Hazardous Materials Table").FirstOrDefault();
var results = chapter.Elements().Where(x => x.Name == "ROW" && x.Attribute("RUL") == null && (x.Elements("ENT").Count() == 14 || x.Elements("ENT").Count() == 2)).Select(y => new
{
chemical_name = y.Elements("ENT").Count() == 14 ? y.Elements("ENT").Skip(1).FirstOrDefault().Value
: y.Elements("ENT").Skip(1).FirstOrDefault().Value == ""
? string.Join("", y.Elements("ENT").Skip(1).FirstOrDefault().Descendants().Select(z => z.NextNode == null ? z.Value : z.Value + z.NextNode.ToString()).ToArray())
: string.Join("", y.Elements("ENT").Skip(1).FirstOrDefault().Value),
classification = y.Elements("ENT").Count() == 14 ? y.Elements("ENT").Skip(2).FirstOrDefault().Value : null,
UN = y.Elements("ENT").Count() == 14 ? y.Elements("ENT").Skip(3).FirstOrDefault().Value : null
}).Where(a => a.chemical_name.Length > 0).ToList();
}
}
}