我正在尝试使用dask而不是pandas,因为我有2.6gb的csv文件。 我加载它,我想删除一列。但似乎没有滴法 df.drop('列')或切片df [:,: - 1]
已实施。是这种情况还是我错过了什么?
答案 0 :(得分:9)
我们在this PR中实施了for(char c = 'a'; c <= 'z'; c++){
bitset<sizeof(char) * CHAR_BIT> binary(c); //sizeof() returns bytes, not bits!
cout << "Letter: " << c << "\t";
cout << "Hex: " << hex << (int)c << "\t";
cout << "Binary: " << binary << endl;
}
方法。这可以从dask 0.7.0开始。
drop
以前人们也可以使用列名称切片;虽然如果你有很多专栏,这当然不那么有吸引力。
In [1]: import pandas as pd
In [2]: df = pd.DataFrame({'x': [1, 2, 3], 'y': [3, 2, 1]})
In [3]: import dask.dataframe as dd
In [4]: ddf = dd.from_pandas(df, npartitions=2)
In [5]: ddf.drop('y', axis=1).compute()
Out[5]:
x
0 1
1 2
2 3