Question

- 编辑 -

正如Daniel Kasatchkow（下文）所建议的那样，我尝试了以下方法：

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

但我得到以下输出：

0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
5    NaN
...

更新 - 仍然无法找到解决方案

Answer 1

尝试这样的事情

import pandas as pd

df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links'])

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

使用正则表达式时，我发现在http://pythex.org/

上试用正则表达式会很有帮助

如果数据采用字典格式，最好使用pandas.DataFrame.from_dict

将其转换为数据框架

使用正则表达式更改行值时循环使用pandas数据框

1 个答案: