使用正则表达式更改行值时循环使用pandas数据框

时间:2016-12-15 22:18:58

标签: python regex python-2.7 pandas for-loop

- 编辑 -

正如Daniel Kasatchkow(下文)所建议的那样,我尝试了以下方法:

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

但我得到以下输出:

0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
5    NaN
...

更新 - 仍然无法找到解决方案

1 个答案:

答案 0 :(得分:1)

尝试这样的事情

import pandas as pd

df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links'])

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

使用正则表达式时,我发现在http://pythex.org/

上试用正则表达式会很有帮助

如果数据采用字典格式,最好使用pandas.DataFrame.from_dict

将其转换为数据框架