如何对Dask SeriesGroup对象执行区分

时间:2018-12-17 12:22:50

标签: dask

我有一个多索引dask数据框,需要执行groupby,然后再进行比较。通过以下命令,此操作对于纯熊猫来说是微不足道的:

def getIncrementationVersions()
{
    // ...

    //find version name in manifest
    def manifestFile = file('src/main/AndroidManifest.xml')
    def matcher = java.util.regex.Pattern.compile('versionName=\"(\\d+)\\.(\\d+)\"').matcher(manifestFile.getText())

    // ...
}    

但是,Dask并未在SeriesGroupBy对象上实现diff函数。我尝试使用以下命令实现自己的命令:

df.groupby('IndexName')['ValueName'].diff().

但这会产生以下错误:

df.groupby('IndexName')['ValueName'].apply(lambda x: x.diff(1) )

任何想法:

下面是示例数据框:

ValueError: Wrong number of items passed 0, placement implies 3987

0 个答案:

没有答案