答案 0 :(得分:1)
读取熊猫数据框。然后,您可以将pandas数据框转换为spark数据框。这就是我做的。该代码将帮助您:
import pandas as pd
store = pd.HDFStore('/mypath')
wav = store.select('mykey')
spark_df = sqlContext.createDataFrame(wav, mySchema) //mySchema is optional
spark_df.take(1)
希望有帮助!