以特定字符开头的行逐行提取元素

时间:2018-09-14 13:58:13

标签: python pandas numpy dataframe data-cleaning

我目前正在使用此DataFrame python:
Extract data frame

该数据集具有一列和n行。

例如,我想提取细节行的细节成分:

对于以'n'开头的每行i,将变量i的第二个元素存储在变量x中。

对于以'e'开头的每行i,将变量i的第二个和第三个元素存储在变量x中。

我想知道我可以使用哪个功能/操作来解决这个问题。

1 个答案:

答案 0 :(得分:1)

创建简单的示例:

d = pd.DataFrame({'a': ['aaaak', 'k jhs', 'anhdga', 'kjdhs']})

您可以使用column.str并看到第一个字母:

data.a.str[0]

退出:

0    a
1    k
2    a
3    k

您可以检查字母是什么

data.a.str[0] == 'a'

退出:

0     True
1    False
2     True
3    False

您只能以第一个字母“ a”来调用raws:

data[data.a.str[0] == 'a']

退出:

        a
0   aaaak
2  anhdga

然后您可以在原始字母中再得到一个以'a'开头的字母:

data[data.a.str[0] == 'a'].a.str[2]

退出:

0    a
2    h