我有一个PySpark数据帧(df),我想在我的Jupyter笔记本中打印出格式精美的表格。
根据post,我认为以下代码可行:
import pandas as pd
from IPython.display import display, HTML
pandas_df = df.toPandas()
display(HTML(pandas_df.to_html()))
不幸的是,这不起作用。我收到以下错误:
ERROR - failed to write data to stream: <__main__.UnicodeDecodingStringIO object at 0x7f75c7a8e750>
有谁知道如何解决这个问题?
谢谢!
答案 0 :(得分:0)
尝试以下操作:
def printDF(inputDF):
newDF = inputDF.toPandas()
from IPython.display import display, HTML
return HTML(newDF.to_html())
您还可以移动import语句,以便将其全局导入,而不是每次调用该函数时都将其导入。希望这会有所帮助。