我最近发现了import.io和有趣的网络抓取工具。现在这个程序允许我用“手动正则表达式覆盖”更改已爬行数据,但我无法弄清楚如何使用它。我有一个字段,其中包含例如此字符串
Actors: Jhon, Mike
我想使用此手动正则表达式覆盖feautre来匹配例如逗号并将其转换为“|”或删除字符串“Actors:”并仅保留“Jhon,Mike”
答案 0 :(得分:0)
您是否只能在“演员:”之后获取数据?
试试这个: “\ w +。+ \ w”或“:( \ w +。+ \ w)”
注意:删除引号。