我有一个如下所述的字符串,基本上是excel文件中的数据。有些行是正确的数据,对于这些正确的数据行,我能够使用lua模式获取我需要的内容。以下是正确的数据行
2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73
我正在使用以下模式,一切正常。
rPattern = “(%d%d%d%d%/%d%d)%S *(%W%W%W [%(重量)%d] [%(重量)%d])%S *(%重量%重量%重量[%(重量)%d] [%(重量)%d]).- [%U%d% - %S] - ([%d%%,] +)%S *([%U%d _% - ] - )%S *([%d%%,] +)%S *([%d%%,] +)%S *(%U%U%U)%S *(%d +%。%d *)%S *(.-)\ n“个
现在有些行带有HTML标签,意味着我的数据在html标签内。我需要的唯一技巧是在HTML标记中获取我需要的字符串。错误的行是
2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a> 18.03 18.03 EUR 1.14977 20.73 20.73
现在从上面一行我想要获取 AAUUM_ARRTC_0211_TBT
我正在尝试尝试但无法做到。有人可以帮我解决上面的问题吗?
由于
答案 0 :(得分:2)
尝试print(str:match(">(.-)<"))
。
答案 1 :(得分:1)
Lua模式匹配无法解析HTML。而“&gt;(.-)&lt;”模式可以在这个特定的实例中工作,它不是任意HTML的通用解决方案。