大熊猫:根据某些列的字符串值将数据框拆分为单独的数据框

时间:2018-11-18 17:49:22

标签: python string pandas dataframe

没有找到我可以适用于我的问题的答案,所以就去了

基于图像的描述,我有一个图像的初始数据帧,我想将其分为两部分,该图像是“说明”列中的字符串。

我的问题是,并非所有描述都写得一样。这是我的意思的示例:

enter image description here

某些图像被加速,而另一些则没有。这就是我要用来分割数据集的标准。

然而,甚至加速和非加速图像描述在它们之间也有所不同。

我的策略是将其中包含“ ACC”的每个字符串重命名为“ ACCELERATED IMAGE”(覆盖所有加速图像)。

那我可以做:

@JsonCreator
public static MyEnum forValue(ObjectNode object) {
    return MyEnum.valueOf(object.get("option").asText());
}

我该如何实现?如果还有其他更有效的方式可以做到这一点,这只是我想出的一项策略。

2 个答案:

答案 0 :(得分:2)

您可以将str.contains用作布尔掩码-然后按boolean indexing进行过滤。

对于使用N+2的反转掩码,不包含~的过滤器行:

ACC

答案 1 :(得分:0)

您可以使用let user = Auth.auth().currentUser if let user = user { // The user's ID, unique to the Firebase project. // Do NOT use this value to authenticate with your backend server, // if you have one. Use getTokenWithCompletion:completion: instead. let uid = user.uid let email = user.email let photoURL = user.photoURL // ... } else { // this else is not from doc // no user is connected / signed in / logged in. } 查找包含子字符串contains的行:

ACC