我有一个多索引dask数据框,需要执行groupby,然后再进行比较。通过以下命令,此操作对于纯熊猫来说是微不足道的:
def getIncrementationVersions()
{
// ...
//find version name in manifest
def manifestFile = file('src/main/AndroidManifest.xml')
def matcher = java.util.regex.Pattern.compile('versionName=\"(\\d+)\\.(\\d+)\"').matcher(manifestFile.getText())
// ...
}
但是,Dask并未在SeriesGroupBy对象上实现diff函数。我尝试使用以下命令实现自己的命令:
df.groupby('IndexName')['ValueName'].diff().
但这会产生以下错误:
df.groupby('IndexName')['ValueName'].apply(lambda x: x.diff(1) )
任何想法:
下面是示例数据框:
ValueError: Wrong number of items passed 0, placement implies 3987