我是XML新手并尝试将XML转换为平面表以在python pandas中使用。大文件的推荐方法是什么(~150MB,20000条记录)。该结构基本上是表格式的,有几个列具有子级别,因此我想要生成的是一个主数据帧和一些链接的数据帧(即具有主数据帧的ID和该列的额外索引)。使用lxml解析xml,然后遍历每个记录以编译列列表以创建pandas数据帧似乎非常慢并且不使用矢量化。
我正在寻找一种适用于多个大文件的方法。使用xslt创建文本文件是一个更好的解决方案吗?我会运行n次 - 每个表/嵌套表一次,还是可以用一个xslt脚本创建多个表?
JComponent editor = spinner.getEditor();
int n = editor.getComponentCount();
for (int i=0; i<n; i++)
{
Component c = editor.getComponent(i);
if (c instanceof JTextField)
{
c.setForeground(Color.red);
c.setBackground(Color.red);
}
}
所以在这种情况下我想要生成两个表 - 一个带索引id和列'name'的记录数据帧和一个带索引(id,index)的'annual'数据帧和一个值为'A'的单个列' B'