我正在尝试使用pyspark在Jupyter笔记本中读取avro文件。当我读取文件时,出现错误。
我已经下载了spark-avro_2.11:4.0.0.jar,我不确定我应该在代码的哪个位置插入avro软件包。任何建议都会很棒。
这是我用来读取avro文件的代码的示例
df_avro_example = sqlContext.read.format("com.databricks.spark.avro").load("example_file.avro")
这是我得到的错误
AnalysisException:'未能找到数据源:com.databricks.spark.avro。请在http://spark.apache.org/third-party-projects.html;'
中找到一个Avro软件包。
答案 0 :(得分:0)
将jar下载到某个位置,并在pyspark应用中使用以下代码段
a = '2019-06-17 10:10:00'
console.log( moment( a ).subtract(1, 'h').format('HH:mm'));