应用错误收集

如何在Docker中将jupyter / all-spark-notebooks容器与hadoop多节点集群连接

时间：2019-07-23 12:07:12

标签： docker apache-spark hadoop pyspark jupyter-notebook

请注意，我是新手。我的要求是在docker中设置具有spark和hive的hadoop多节点集群。

我已经拉出了一个使用uhopper / hadoop映像和jupyter笔记本建立的hadoop多节点集群，以访问我使用pyspark在hdfs中摄取的txt文件。现在，在单独的容器中有jupyter，在其他容器中有hadoop集群，我如何告诉jupyter Notebook在现有的hadoop集群上运行？

请提出任何更好的方法来满足我的要求。

0 个答案:

没有答案

具有Docker的多节点Hadoop集群
具有CDH的Dockerized多节点Cassandra集群
如何从云端shell连接到具有Jupyter笔记本的数据集群
如何在多节点Hadoop集群上设置Spark？
如何使用docker连接jupyter笔记本
Sparks工作在多节点纱线集群中挂起
笔记本在Docker容器中对Jupyter来说不是持久的吗？
如何从docker容器内的JupyterLab连接到Yarn群集上的Spark？
如何在Docker中将jupyter / all-spark-notebooks容器与hadoop多节点集群连接
如何使用Jupyter Notebooks中可用的Python 2和Python 3创建docker容器？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？