我正在尝试使用博客https://datafloq.com/read/real-time-kafka-data-ingestion-into-hbase-pyspark/2658
使用Pyspark创建从Kafka到HBase的实时管道。导入软件包时遇到以下错误:
从pyspark_ext导入*
回溯(最近通话最近): 文件“”,第1行,位于 ModuleNotFoundError:没有名为“ pyspark_ext”的模块
此软件包是强制性的吗?
我在线搜索,但只能找到一个链接:py4j.protocol.Py4JJavaError: org.apache.spark.SparkException: Must specify metadata.broker.list or bootstrap.servers-但没有提供解决方案。 感谢是否有人可以对此查询发表评论。
预先感谢