标签: .net sql xml etl
我们的州政府已经开通了运输时间表数据。数据采用基于xml的TransXchange标准格式。
问题是数据文件很大。示例数据文件本身为300 MB。
好处是大部分数据都是多余的,我的应用程序不需要它。我想知道我有什么选择只将我需要的数据插入/转换到SQL Server中?
感谢。
答案 0 :(得分:2)
您需要一个XML流(基于事件)解析器,以避免将整个树加载到内存中。大多数语言都有几种基于SAX(Simple API for XML)标准。