我有一大堆自由文本大致遵循这样的形式:
Oracle帐号#: 索赔判决: 订单类型:
自由文本看起来像这样
Oracle帐号::123456Claim判决:ApprovedOrder类型:FURN
我认为我能做的就是使用正则表达式来寻找第一个属性" Oracle Account#:"然后是一段不在表格属性语料库中的文本,然后在那里的任何内容上结束。所以它看起来像
'Oracle Account #:(?!Oracle Account #:|Claim Judgment:|Order Type:)(Oracle Account #:|Claim Judgment:|Order Type:)'
然后用\ 1提取,但是这无法识别我提供的样本。知道这可能有用吗?