检索熊猫数据框中字符串的特定部分

时间:2019-02-20 16:32:04

标签: python pandas seaborn

我有一个要求。我在一个字段中有一些值:

project(':react-native-gesture-handler').projectDir = new File(rootProject.projectDir, '../node_modules/react-native-gesture-handler/android')

如果您查看第8行,我可能也会输入空数据。

要求是提取置信度并从中建立热图

本质上,我需要一列,其值类似于

0      [{'name': 'Skyscraper', 'conf': 0.726202309131...

1      [{'name': 'Tree', 'conf': 0.7405981421470642, ...

2      [{'name': 'Castle', 'conf': 0.8047274947166443...

3      [{'name': 'Building', 'conf': 0.94974970817565...

4      [{'name': 'Airplane', 'conf': 0.79357206821441...

5      [{'name': 'Tree', 'conf': 0.8992922306060791, ...

6      [{'name': 'Tree', 'conf': 0.943131983280182, '...

7      [{'name': 'Snowboard', 'conf': 0.8854210376739...

8                                                     []

9      [{'name': 'Sculpture', 'conf': 0.6212946772575...

10     [{'name': 'Tree', 'conf': 0.9138262867927552, ...

11     [{'name': 'Person', 'conf': 0.9718038439750672...

12     [{'name': 'Person', 'conf': 0.9445680975914, '...

13     [{'name': 'Tree', 'conf': 0.8676704168319702, ...

14     [{'name': 'Person', 'conf': 0.9166923761367798...

15     [{'name': 'Tree', 'conf': 0.9771925806999208, ...

16     [{'name': 'Snowboard', 'conf': 0.6349108815193...

17     [{'name': 'Person', 'conf': 0.9804859161376952...

...等等,依此类推

可以做到吗?

1 个答案:

答案 0 :(得分:0)

您的问题尚不清楚,但首先将数据输入数据框。

完成此操作后,选择要使用空值的内容。一种选择是完全删除它们,如下所示。从那里直接隔离只有置信度的列。

如果您希望返回“ conf”列并在小数点后保留所需的位数,请在列上使用“ apply”方法和lambda表达式。

import pandas as pd

# create dataframe, assume your list of dictionaries is in a variable 'x'
df = pd.DataFrame(x)
#drop all NaN columns if desired. Otherwise look at pandas documentation for NaN handling options
df = df.dropna()

#isolating the 'conf' column and limiting output to three decimal places
conf_column = df['conf'].apply(lambda x: round(x,3))

这将返回一个熊猫系列。 Seaborn与数据框/系列无缝协作以创建热图。在不了解您的最终目标的情况下,我无法提供有关热图的建议,但是熊猫和海底文件很简单。