我有一个Dask数据框,似乎加载得很好,但是由于'?',我无法保存它DF中的某个地方。
我做了什么:
def replace(x: pd.DataFrame) -> pd.DataFrame:
return x.replace('?',np.nan)
ddf_short0 = ddf_short.map_partitions(replace)
ddf_short0
返回的内容:
AttributeError跟踪(最近的调用) 持续) /home/user/anaconda3/lib/python3.5/site-packages/IPython/core/formatters.py 在通话中(自己,obj) 670 type_pprinters = self.type_printers, 第671章 -> 672 printer.pretty(obj) 673 printer.flush() 674返回stream.getvalue()
/home/user/anaconda3/lib/python3.5/site-packages/IPython/lib/pretty.py 用漂亮的(自己,obj) 381(如果可调用(甲基)): 382 return meth(obj,self,cycle) -> 383 return _default_pprint(obj,self,cycle) 384最后: 385 self.end_group()
/home/user/anaconda3/lib/python3.5/site-packages/IPython/lib/pretty.py 在_default_pprint(obj,p,cycle)中 501如果_safe_getattr(klass,' repr ',None)不在_baseclass_reprs中: 502#用户提供的代表。查找换行符并将其替换为p.break_() -> 503 _repr_pprint(obj,p,cycle) 504返回 505 p.begin_group(1,'<')
/home/user/anaconda3/lib/python3.5/site-packages/IPython/lib/pretty.py 在_repr_pprint(obj,p,cycle)中 699“”“仅重定向到常规repr功能的pprint。”“” 700#查找换行符,然后将其替换为p.break_() -> 701输出= repr(obj) 702 for idx,enumerate(output.splitlines())中的output_line: 703,如果idx:
/home/user/anaconda3/lib/python3.5/site-packages/dask/dataframe/core.py 在代表中(自己) 392 393 def repr (自己): -> 394数据= self._repr_data.to_string(max_rows = 5,show_dimensions = False) 395 return“”“ Dask {klass}结构: 396 {data}
/home/user/anaconda3/lib/python3.5/site-packages/dask/dataframe/core.py 在 getattr (自身,密钥)2518中返回 new_dd_object(merge(self.dask,dsk),名称,2519
元,自我划分) -> 2520提高AttributeError(“'DataFrame'对象没有属性%r“%键)2521 2522 def dir ((自身)):AttributeError:“ DataFrame”对象没有属性“ _repr_data”
有什么想法吗?谢谢