我刚开始管理Hadoop集群。我们使用Bright Cluster Manager直到O / S级别(CentOS 7.1),然后使用Ambari和Hortonworks HDP 2.3 for Hadoop。
我不断收到要安装新python模块的请求。我们在安装时使用yum安装了一些模块,随着集群的进展,一些模块已经使用pip安装。
什么是"权利"这样做的方法?总是使用yum而不能提供最新最好的模块?总是使用pip并没有一个真实点(yum)显示安装了哪些软件包?或者同时使用pip和yum都可以吗?
我只是担心我用垃圾和太多版本的python模块填充系统。有什么建议吗?
答案 0 :(得分:2)
作为您的发行版的一部分的软件包应该是首选,因为它们已经过测试,可以在您的系统上正常运行。这些软件包是在系统范围内安装的。
但是,如果没有提供合适的RPM软件包,请继续安装,例如从尽可能使用[assembly: CollectionBehavior(DisableTestParallelization = true)]
,但部署虚拟Python环境的PyPi或github。使用虚拟环境,您不必在系统范围内安装第三方软件包。您将拥有几套较小的软件包,这些软件包可以作为一套更易于管理。