大型XML到平面表Python / Pandas

时间:2016-10-07 16:52:45

标签: python xml pandas xslt lxml

我是XML新手并尝试将XML转换为平面表以在python pandas中使用。大文件的推荐方法是什么(~150MB,20000条记录)。该结构基本上是表格式的,有几个列具有子级别,因此我想要生成的是一个主数据帧和一些链接的数据帧(即具有主数据帧的ID和该列的额外索引)。使用lxml解析xml,然后遍历每个记录以编译列列表以创建pandas数据帧似乎非常慢并且不使用矢量化。

我正在寻找一种适用于多个大文件的方法。使用xslt创建文本文件是一个更好的解决方案吗?我会运行n次 - 每个表/嵌套表一次,还是可以用一个xslt脚本创建多个表?

JComponent editor = spinner.getEditor();
        int n = editor.getComponentCount();
        for (int i=0; i<n; i++)
        {
            Component c = editor.getComponent(i);
            if (c instanceof JTextField)
            {
                c.setForeground(Color.red);
                c.setBackground(Color.red);
            }
        }

所以在这种情况下我想要生成两个表 - 一个带索引id和列'name'的记录数据帧和一个带索引(id,index)的'annual'数据帧和一个值为'A'的单个列' B'

0 个答案:

没有答案