根据timedelta和index

时间:2016-06-10 23:28:56

标签: python numpy pandas

我想在pandas数据框中更改我的数据。

我收集的数据需要分配一个步骤值。触发阶跃变化的条件有时是时间或高压或温度值。我无法通过第一步:当行超过一定压力(1100 psi)和温度(40℃)时,这就是"稀释"相。

尝试使用以下内容更改值时:

df.ix[(df['press'] > 1100) & (df['temp'] < 40),'proc'] = 'dilute';

我似乎只修改了前两行。

items[0].head()
Out[37]: 
              time       mass       temp       press        proc
time                                                            
00:00:00  10:58:07  21.947102  23.306101    1.830506      dilute
00:00:01  10:58:08  22.076259  23.306101   57.274142      dilute
00:00:02  10:58:09  22.094710  23.306101  196.000203  pressurize
00:00:03  10:58:10  22.113161  23.306101  293.318991  pressurize
00:00:03  10:58:10  22.094710  23.306101  361.161415  pressurize

items[0].tail()
Out[38]: 
              time       mass       temp     press        proc
time                                                          
00:36:12  11:34:19  18.201538  39.798763 -1.678585  pressurize
00:36:13  11:34:20  18.183087  39.719165 -1.444645  pressurize
00:36:14  11:34:21  18.183087  39.671407 -1.444645  pressurize
00:36:15  11:34:22  18.219989  39.703246 -1.444645  pressurize
00:36:16  11:34:23  18.201538  39.758964 -1.444645  pressurize

经过进一步检查,索引似乎确实有效,给我一个指数,我希望看到稀释发生...

print(df.ix[(df['press'] > 1100) & (df['temp'] < 40),'proc'].head(),
                df.ix[(df['press'] > 1100) & (df['temp'] < 40),'proc'].tail())
time
00:00:26    pressurize
00:00:27    pressurize
00:00:28    pressurize
00:00:29    pressurize
00:00:30    pressurize
Name: proc, dtype: object time
00:26:08    pressurize
00:26:09    pressurize
00:26:10    pressurize
00:26:11    pressurize
00:26:12    pressurize
Name: proc, dtype: object

然而,当将它应用于我的数据时,我只获得前两个值的更改,以及消息 -

  

FutureWarning:将来,boolean array-likes将作为一个处理   布尔数组索引值[indexer] = value&#39;

运行cookbook examples会产生预期的响应。

似乎我有一个嵌套索引,但我不清楚为什么或如何去修改它。这里有几个层次,搜索解决方案尚未证明有用或提供了帮助澄清的最佳途径。

我想重置索引,并使用数字,但我需要按值和timedeltas排序。

索引是timedelta,我需要规范化在多个时段内启动的多次运行,以便在0秒内同时启动所有运行。我的搜索仅产生日期变换而不是时间,因此我使用timedelta索引将归一化值归零。

如果有更好的方式来发布此问题,或更清晰,请询问。我更愿意增加清晰度或修剪。很难预测专业编码人员会得到什么有用的信息。

2 个答案:

答案 0 :(得分:4)

试试这个

df['press'].astype('float')
df['temp'].astype('float')

df['proc']  = np.where((df['press'] > 1100) & (df['temp'] < 40),'dilute', "pressurized")

答案 1 :(得分:1)

使用.loc代替.ix

df.loc[(df.press > 1100) & (df.temp < 40), 'proc'] = 'dilute'