标签: python-2.7 apache-spark pyspark
我正在尝试使用pyspark将一堆protobuf编码的消息作为拼写文件写在磁盘上。我已经为protbuf模式生成了pb2文件。我能够解析消息并从中创建一个rdd。但是无法找出将这些消息字段转换为列的方法,从而无法创建可最终写入磁盘的spark数据帧。