所以给出了这个例子系列
s = pd.Series(["Redirecting (301) to <GET http://www.vix.com/pt/mulher> from <GET http://www.vix.com/pt/bolsademulher>'",
"Redirecting (307) to <GET https://twibbon.com/> from <GET http://twibbon.com/>'"])
我能够像这样提取第一个网址:
s.str.extract('(https?://[^>]+)', expand=True)
但我想将两个网址都提取到不同的列中。
答案 0 :(得分:2)
s.str.extractall('(https?://[^>]+)').unstack()