我目前正在使用此DataFrame python:
该数据集具有一列和n行。
例如,我想提取细节行的细节成分:
对于以'n'开头的每行i,将变量i的第二个元素存储在变量x中。
或
对于以'e'开头的每行i,将变量i的第二个和第三个元素存储在变量x中。
我想知道我可以使用哪个功能/操作来解决这个问题。
答案 0 :(得分:1)
创建简单的示例:
d = pd.DataFrame({'a': ['aaaak', 'k jhs', 'anhdga', 'kjdhs']})
您可以使用column.str并看到第一个字母:
data.a.str[0]
退出:
0 a
1 k
2 a
3 k
您可以检查字母是什么
data.a.str[0] == 'a'
退出:
0 True
1 False
2 True
3 False
您只能以第一个字母“ a”来调用raws:
data[data.a.str[0] == 'a']
退出:
a
0 aaaak
2 anhdga
然后您可以在原始字母中再得到一个以'a'开头的字母:
data[data.a.str[0] == 'a'].a.str[2]
退出:
0 a
2 h