Question

我有一个如下所述的字符串，基本上是excel文件中的数据。有些行是正确的数据，对于这些正确的数据行，我能够使用lua模式获取我需要的内容。以下是正确的数据行

2011/02 ARRTC AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER ARRTC-AAUUM-TBT-2011-02 0.00 AAUUM_ARRTC_0211_TBT 18.03 18.03 EUR 1.14977 20.73 20.73

我正在使用以下模式，一切正常。

rPattern = “（％d％d％d％d％/％d％d）％S *（％W％W％W [％（重量）％d] [％（重量）％d]）％S *（％重量％重量％重量[％（重量）％d] [％（重量）％d]）.- [％U％d％ - ％S] - （[％d％％，] +）％S *（[％U％d _％ - ] - ）％S *（[％d％％，] +）％S *（[％d％％，] +）％S *（％U％U％U）％S *（％d +％。％d *）％S *（.-）\ n“个

现在有些行带有HTML标签，意味着我的数据在html标签内。我需要的唯一技巧是在HTML标记中获取我需要的字符串。错误的行是

2011/02 ARRTC   AAUUMCO ZZITNWMOBILE COMMUNICATIONS CENTER  ARRTC-AAUUM-TBT-2011-02 0.00    <a href="/cgi-bin/recon_detail?rectent=AAUUM&benificary=ARRTC&period=2011/02&svctype=Voice">AAUUM_ARRTC_0211_TBT</a>    18.03   18.03   EUR 1.14977 20.73   20.73

现在从上面一行我想要获取 AAUUM_ARRTC_0211_TBT

我正在尝试尝试但无法做到。有人可以帮我解决上面的问题吗？

由于

Answer 1

尝试print(str:match(">(.-)<"))。

Answer 2

Lua模式匹配无法解析HTML。而“＆gt;（.-）＆lt;”模式可以在这个特定的实例中工作，它不是任意HTML的通用解决方案。

Lua模式：如何获取所需的字符串

2 个答案: