Question

我给出了这一系列带索引的数据点;所以数据框看起来像这样：

index        value
0            3.075
1           44.338
2           10.030

然后我编写了一个函数get_extrema，它找到所有局部极值，并返回一个包含3列的数据框：index，value，type。

index =原始给定数据集中极值的索引

value =找到的局部极值的值

type =＆＃39; max＆＃39;或者＆＃39; min＆＃39;

然后，使用get_extrema的结果，我写了另一个函数来找出极值对的幅度（也就是局部最小值和局部最大值之间的值的差异）......我＆＃39; d只想返回幅度最大的顶对：

def get_amplitude(extremas, col, n):
    amps = abs(extremas[col].diff(periods=1))
    amps.sort_values(inplace=True, ascending=False)
    amps = amps.head(n)

    df = pd.DataFrame({'local minima': extremas.loc[amps.index, 'value'],
                       'local maxima': extremas.loc[amps.index - 1, 'value']})

    return df

Extremas是get_extremas的数据帧输出，col是包含所提到的数据帧中极值的列的名称，n是本地min之间具有最大差异的前n对的数量/ max pair。

它工作正常，但答案输出有点奇怪：

+-------------------------------------+
|       | local maxima | local minima |
+-------+--------------+--------------+
| 17398 | 433.75       | NaN          |
| 17399 | NaN          | -99.00       |
| 17551 | 438.00       | NaN          |
| 17552 | NaN          | -88.25       |
| 21262 | 437.75       | NaN          |
| 21263 | NaN          | -120.75      |
+-------+--------------+--------------+

我想要的输出：

+-------------------------------------+
|       | local maxima | local minima |
+-------+--------------+--------------+
| 0     | 433.75       | -99.00       |
| 1     | 438.00       | -88.25       |
| 2     | 437.75       | -120.75      |
+-------+--------------+--------------+

我理解我的输出格式是由于我试图合并的两个数据帧有不同的索引。但是我怎么能克服这个呢？

我无法使用df.merge(df2)，因为他们不会共享相同的密钥。

我觉得必须有一个非常简单的解决方案，我忽略了。任何帮助表示赞赏！

Answer 1

这对你的情况有帮助吗？我不确定我们是否在同一页上，但我认为这是你要做的 -

import pandas as pd
import numpy as np
# create random data
amps = pd.DataFrame(np.random.randint(0,100,size=(5, 1)), columns=['value'])
extremas = pd.DataFrame(np.random.randint(0,100,size=(5, 1)), columns=['value'])

# this part 
minima = extremas.loc[amps.index, 'value'].reset_index(drop=True)
maxima = extremas.loc[amps.index - 1, 'value'].reset_index(drop=True)
df = pd.DataFrame({'local minima':minima ,'local maxima': maxima})

如何合并两个具有不同索引的数据框？

1 个答案: