- 编辑 -
正如Daniel Kasatchkow(下文)所建议的那样,我尝试了以下方法:
df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')
但我得到以下输出:
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
...
更新 - 仍然无法找到解决方案
答案 0 :(得分:1)
尝试这样的事情
import pandas as pd
df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links'])
df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')
使用正则表达式时,我发现在http://pythex.org/
上试用正则表达式会很有帮助如果数据采用字典格式,最好使用pandas.DataFrame.from_dict
将其转换为数据框架