我有一个需要使用XSLT 2.0解析的字符串
输入字符串
Hoffmann, Rüdiger (Universtiy-A, SomeCity, (SomeCountry); University-B, SomeCity, (SomeCountry)); Author, X; Author, B. (University-C, SomeCity (SomeCountry))
预期输出
Hoffmann, Rüdiger (Universtiy-A, SomeCity, (SomeCountry); University-B, SomeCity, (SomeCountry))
Author, X
Author, B. (University-C, SomeCity (SomeCountry))
结构是 - 作者姓名,其次是他的大学。但是,一位作者可以拥有两所大学。大学之间和两组作者之间的界限是相同的。 (在这种情况下是分号)。
我需要根据作者联盟组的分隔符拆分它,忽略从属关系和作者姓名(HTML实体)之间的分号。
我相信它可以在正则表达式的帮助下完成,但我自己构建正则表达式的经验并不多。