我的目标是从不同的提问者doc文件制作xml文件。
例如。
Interviewer Name: Mr. K </br>
Street: BD
Company: ABC
Mr. K: What is your Name? What is your father name?
Mr. R: My name is R.
My father name is Z.
Mr. K: What is your hobby?
Mr. R: I like to play football.
......................
等等。
现在,我想从doc文件中解析它并转换为xml文件。 xml文件如下所示
<interview>
<information>
<p>Interviewer Name: Mr. K</p>
<p>Street: BD </p>
<p>Company: ABC</p>
</information>
<question><p>What is your Name? What is your father name?</p></question>
<answer>
<p>My name is R.</p>
<p>My father name is Z. </p>
</answer>
<question><p>What is your hobby?</p></question>
<answer>
<p>I like to play football.</p>
<p>.......</p>
</answer>
</interview>
代码
我使用POI api读取doc文件和DOM api来创建XML。但我的主要问题是 我可以通过算法识别问题,答案和信息块。 你能给我一些想法吗?
答案 0 :(得分:2)
我曾经使用过JaxB这个问题。您创建一个与您的XML等效的Java类。然后JaxB将该类的实例转换为XML,反之亦然。
看看这个: