我在ipython
到pyspark
中有一个数字列表,如下所示:
df = pd.DataFrame(index=range(N))
df['total'] = data.map(lambda x:(x.features[0]+x.features[1]+x.features[2])).collect()
现在这个列表中的一些数字在小数点后面有两位数字,如10.17
,但是有些数字在小数点之后少于两位数,如9.1
,或者有些数字没有任何小数例如5
或23
。我想要的是将小数点后的所有数字都设为两位数。如果他们没有两位数字,那么应该添加结尾0,就像上面的9.1
应该成为9.10
而5
应该成为5.00
。我怎么能这样做?
注意:我看过那些重新格式化的帖子,但我的重新格式化特别针对pyspark
和map()
函数。我如何在那里重新格式化?
答案 0 :(得分:0)
地图lambda函数中不会显示。当collect()返回结果数组时,这些值将被实现。然后,您将格式应用于这些结果。