标签: java regex unicode
我需要处理一个如下所示的文件:
þ一些数据þþ一些数据þþGEVA_BOD_000062þþGEVA_BOD_000119þ
我想拆分文件的行,以便我可以独立地处理每个数据成员。问题是,我不知道如何使用“”,互联网告诉我的是“设备控制4”(U + 0014)。如何将此字符合并到正则表达式中以便我可以正确地拆分字符串? (þ|þþ)根本不会拆分字符串。