不能使用dask删除列或切片数据帧?

时间:2015-08-07 00:47:29

标签: dask

我正在尝试使用dask而不是pandas,因为我有2.6gb的csv文件。 我加载它,我想删除一列。但似乎没有滴法 df.drop('列')或切片df [:,: - 1]

已实施。是这种情况还是我错过了什么?

1 个答案:

答案 0 :(得分:9)

我们在this PR中实施了for(char c = 'a'; c <= 'z'; c++){ bitset<sizeof(char) * CHAR_BIT> binary(c); //sizeof() returns bytes, not bits! cout << "Letter: " << c << "\t"; cout << "Hex: " << hex << (int)c << "\t"; cout << "Binary: " << binary << endl; } 方法。这可以从dask 0.7.0开始。

drop

以前人们也可以使用列名称切片;虽然如果你有很多专栏,这当然不那么有吸引力。

In [1]: import pandas as pd

In [2]: df = pd.DataFrame({'x': [1, 2, 3], 'y': [3, 2, 1]})

In [3]: import dask.dataframe as dd

In [4]: ddf = dd.from_pandas(df, npartitions=2)

In [5]: ddf.drop('y', axis=1).compute()
Out[5]: 
   x
0  1
1  2
2  3