以通用方式从平面文件转换为XML

时间:2017-05-27 18:06:00

标签: java xml dom

我正在写一个通用的(实际上不太通用;两个假设:1>每个元素必须是强制性的2>如果有任何多个段,那么它应该恰好发生在' n'次)程序它可以从CCB / flat-file生成XML。 我提供了一个字符串输入,考虑到现在的平面文件的内容和配置xml,它只是xml格式的XSD图片。

我在下面提供这些输入:

<complex name="PARENT">
<complex name="CHILD">
    <complex name="GRANT-CHILD" count="2">
        <field name="A" length="7"/>
        <field name="B" length="11"/>
        <field name="C" length="7"/>
        <field name="D" length="7"/>
        <field name="E" length="1"/>
        <field name="F" length="20"/>
        <field name="G" length="10"/>
        <field name="H" length="10"/>
        <field name="I" length="7"/>
        <field name="J" length="7"/>
        <field name="K" length="7"/>
        <field name="L" length="7"/>
    </complex>
</complex>

`

示例XML将如下所示:

<PARENT>
<CHILD>
    <GRANT-CHILD>
        <A />
        <B />
        <C />
        <D />
        <E />
        <F />
        <G />
        <H />
        <I />
        <J />
        <K />
        <L />
    </GRANT-CHILD>
    <GRANT-CHILD>
        <A />
        <B />
        <C />
        <D />
        <E />
        <F />
        <G />
        <H />
        <I />
        <J />
        <K />
        <L />
    </GRANT-CHILD>
</CHILD>

我的逻辑是,无论何时complex类型,我都会使用相应的属性(name)生成标记,当它是field时,我会使用length I&#39;我正在寻找属性package x.y.z; import org.w3c.dom.Element; import org.w3c.dom.Node; public class ChildEle { public static Element getFirstChildElement(Node parent) { Node child = parent.getFirstChild(); while (child != null) { if (child.getNodeType() == Node.ELEMENT_NODE) return (Element)child; child = child.getNextSibling(); } return null; } public static Node getNextSiblingElement(Node present) { Node node = present.getNextSibling(); while (node != null && !(node instanceof Element)) node = node.getNextSibling(); return node; } } 的值并从输入字符串中获取那些多个字符并在xml中创建一个标记,并用空格替换字符串中的那些字符。我有两个课程,提供如下:

package x.y.z;

import java.io.File;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;

public class FlatFileConversion {

public static void realmethod(Node node,String sto)
{
    if(node.getNodeName()=="complex")
    {   
        Element eElement = (Element)node;
        if(eElement.hasAttribute("count"))
        {
            String st=eElement.getAttribute("count");
            int x=Integer.parseInt(st);
            for(int i=0;i<x;i++)
            {
                System.out.println("<"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
                realmethod((Node)ChildEle.getFirstChildElement(node),sto);
                System.out.println("</"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
            }
        }
        else
        {
            System.out.println("<"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
            realmethod((Node)ChildEle.getFirstChildElement(node),sto);
            System.out.println("</"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
        }
    }
    if(node.getNodeName()=="field")
    {
        String str2=sto.substring(0, Math.min(sto.length(),Integer.parseInt(node.getAttributes().getNamedItem("length").getNodeValue())));
        System.out.print("<"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
        System.out.print(str2.trim());
        System.out.println("</"+node.getAttributes().getNamedItem("name").getNodeValue()+">");
        sto=sto.replace(str2, "");
        try
        {
            realmethod(ChildEle.getNextSiblingElement(node),sto);
        }
        catch(Exception e)
        {

        }
    }
}
public static void main(String[] args) {

    String inp="74c83tjrl1nd7jmko3hg8octgitmicte3m0eq8mzmw7zae0sqgwrj4ylzueb9lzabc3hcu78lly3nwbi18ncw1mvu039ruvz5cju2vcyeq5upzsks9rn7jz75edrh2cbcxxh758ztvpkhyjb61al5eczc57bcizfoo1dhtdljd1gfzs69tqo9vqhiqt44gmbfdq7oddjfa";
    try
    {
         File inputFile = new File("E:\\test\\input.txt");
         DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
         DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
         Document doc = dBuilder.parse(inputFile);
         doc.getDocumentElement().normalize();
         realmethod((Node)doc.getDocumentElement(),inp);
    }
    catch(Exception e)
    {
        e.printStackTrace();
    }
}
}

,第二个是

<PARENT>
<CHILD>
    <GRANT-CHILD>
        <A>74c83tj</A>
        <B>rl1nd7jmko3</B>
        <C>hg8octg</C>
        <D>itmicte</D>
        <E>3</E>
        <F>m0eq8mzmw7zae0sqgwrj</F>
        <G>4ylzueb9lz</G>
        <H>abchcu78ll</H>
        <I>ynwbi18</I>
        <J>ncw1mvu</J>
        <K>09ruvz5</K>
        <L>cju2vcy</L>
    </GRANT-CHILD>
    <GRANT-CHILD>
        <A>74c83tj</A>
        <B>rl1nd7jmko3</B>
        <C>hg8octg</C>
        <D>itmicte</D>
        <E>3</E>
        <F>m0eq8mzmw7zae0sqgwrj</F>
        <G>4ylzueb9lz</G>
        <H>abchcu78ll</H>
        <I>ynwbi18</I>
        <J>ncw1mvu</J>
        <K>09ruvz5</K>
        <L>cju2vcy</L>
    </GRANT-CHILD>
</CHILD>

输出如下:

GRANT-CHILD

具有两次出现次数的if ($result->num_rows > 0) { echo "<table>"; echo "<tr>"; echo "<th>Name</th>"; echo "<th>Date</th>"; echo "<th>Form</th>"; echo "</tr>"; while($row = $result->fetch_assoc()) { echo "<tr>"; echo "<td>". $row["name"] . ' ' . $row["surname"]. "</td>"; echo "<td>". $row["date"]. "</td>"; echo "<td><p class='message'><a href='form.php'>Show form</a></p></td>"; echo "</tr>"; } } else { echo "No data found"; } echo "</table>"; 段生成完全相同;对于第二个段,我的代码无法从输入字符串中选取字符,并将它们作为文本节点放置到相应的元素节点。

请帮助解决逻辑错误。

1 个答案:

答案 0 :(得分:1)

没有真正回答你的问题,但是因为你正在解决同样的问题而知道它可能是有用的...

Open Grid论坛上有一个名为“数据格式定义语言”(DFDL)的标准。 IBM已在其集成软件中实施DFDL: https://en.wikipedia.org/wiki/Data_Format_Description_Language

并且有一个独立的开源实现: https://opensource.ncsa.illinois.edu/confluence/display/DFDL/Daffodil%3A+Open+Source+DFDL

DFDL可以描述平面文件,但也可以处理各种分隔和标记数据。