如何使用python将文本转换为xml?

时间:2019-02-25 08:56:58

标签: xml text

我想使用python或Java将文本文件转换为xml文件,

我的文字:

  

“咖啡馆是一个地方,咖啡馆有地址和营业时间”

我的目标是生成一个描述文本中所有实体的文件xml

1 个答案:

答案 0 :(得分:0)

关于xml的目标,您需要更加具体一些,以获取有关问题的最佳帮助。您可以用多种方式来解释它,从而留下许多可能的解决方案要讨论。

  • 您是否想要一段始终将.txt转换为.xml的代码? (难)
  • 您是否只想转换这一行,那还好吗? (简单)
  • 您是否正在例如Jdeveloper中寻找一个选项,以上传.txt并将其更改为.xml以进行进一步处理(简单但具体)。

无论出于何种目的寻找答案,.txt文件中文本的结构方式都非常重要。如果它的结构像一个句子(如您的示例所示),则很难为其编写一些通用代码。但是,如果它类似于以下内容,或者您​​可以按照以下方式准备.txt文件:

1: 
Make········Model····Year····Mileage
2: 
BMW·········R1150RS··2004····14274··
3: 
Kawasaki····GPz1100··1996····60234··

然后实际上将非常容易。格式转换通常是调整数据结构的问题。 在上面的示例中,我从Quora的以下问题中获取了答案。我确定该链接对您的事业非常有帮助!

Wall of text on .txt to .xml on quora

祝你好运!

Jesper

编辑: ,作为对您的评论的回应。实际上,字符串很难转换为表,除非字符串始终包含某些特征。的确,“咖啡馆是一个地方,咖啡馆有一个地址,营业时间”。如果下一个句子是:“游泳池是一个地方,游泳池有地址和营业时间”。您可以编写一个子字符串函数(对于xslt中的子字符串,为http://www.xsltfunctions.com/xsl/fn_substring.html),该函数接受一个句子并将其在字符串中重复出现的实体之后的可用信息剥离。但是,最好使用上面的示例,并以一种比句子更容易转换的方式格式化.txt数据的格式,例如逗号分隔的文件。

Cafe, Pool, Library, School, Gym, Work,
Place, Adress, Opening Hours,