Imacros正则表达式,我问的太复杂了吗?

时间:2017-02-12 18:22:13

标签: regex screen-scraping imacros

我正在尝试使用IMACROS为即将到来的网球比赛提取球员名称,以便稍后在excel中进行分析。

我想从中获取玩家名称的网站会产生我不想要的额外信息。

Horacio Zeballos(ARG)
Joao Sousa(PRT) Victor Estrella Burgos(DOM)SE

Tommy Robredo(ESP)PR Fabio Fognini(ITA)LL

Albert Ramos-Vinolas(ESP)5
Guido Pella(ARG)
Leonardo Mayer(ARG)WC

当我使用下面的提取标签时,我得到了我不需要的额外信息。

TAG POS = 1 TYPE = TD ATTR = CLASS:player-name EXTRACT = TXT

我对正则表达式并不擅长,并且不知道如何编写表达式以删除“(”之后的所有数据,并删除尾随空格,只留下玩家名称。

任何建议都将受到赞赏。

非常感谢

1 个答案:

答案 0 :(得分:0)

尝试按以下方式删除额外信息:

TAG POS=1 TYPE=TD ATTR=CLASS:player-name EXTRACT=TXT
SET !EXTRACT EVAL("'{{!EXTRACT}}'.replace(/ \\(.+/gm, '');")