我有一个从Informatica生成的大型XML文件,它有多次出现的空XML标记,如下所示,需要从文件中删除。
<Person> <Address> </Address> </Person>
该文件包含大约600-800次出现的上述6行文本,所有这些文本都需要删除。
这些标签之间可能存在数据,在这种情况下不应删除它们。仅当文本以与上面显示的完全相同的方式显示时,才应该删除。 PS-perl命令在我的UNIX框中不起作用
答案 0 :(得分:0)
Awk是面向行的,但您可以使用状态机执行多行处理。如果没有更多的架构细节和样本数据,很难确切知道它应该如何表现。但假设每个标签都在自己的行上,那么应该是可能的。
以下是一个简单的例子,说明如何解决这个问题(一个起点,你应该能够定制你的数据):
criteriaQuery.select(root).where(builder.equal(root.get("dadosBoleto").get("dataVencimento").as(Date.class), new Date()));