import databricks.koalas as ks
df = ks.DataFrame({'x': [1, 2], 'y': [3, 4], 'z': [5, 6]})
df.columns = ['x', 'y', 'z1']
df['x2'] = df.x + df.x
print(df)
在JupyterNotebook中运行时无法获得任何输出。代码在“警告:root:找到的pyspark版本“ 2.3.0”已安装的情况下连续运行。建议pyspark> = 2.4.0。”
以下是使用的库。
pandas- 0.25
PySpark- 2.3
pyarrow- 0.13
matplotlib - 3.1
databricks - 0.2
koalas - 0.21