我已使用sc.textFile
将CSV文件加载到RDD格式gExp = sc.textFile("/mnt/%s/RNA-Seq/GSE10846_Gene_Expression_Data.csv" % MOUNT_NAME)
我想将其转换为Spark DataFrame
header = gExp.take(1)
data = gExp.filter(lambda row : row != header).toDF(header)
在这里,我收到一个错误:
TypeError:无法推断类型的架构: