我正在尝试使用python连接到远程Hive群集。我尝试了pyhive,pyhs2,但没有成功。使用下面的代码,我可以连接到蜂巢,但是如何将结果打印并保存到熊猫数据框中?
我尝试了以下几行,没有任何运气: out = stdout.read() 打印stdout.read()
import os
import paramiko
ssh = paramiko.SSHClient()
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
ssh.load_host_keys(os.path.expanduser(os.path.join("~", ".ssh", "known_hosts")))
ssh.connect('00.00.00.00.', username='******', password='*******')
sshin, sshout, ssherr= ssh.exec_command('hive -e "select * from t1"')
我要打印结果并将其保存在熊猫数据框中。
答案 0 :(得分:0)
如果您打算将结果加载到熊猫DataFrame
中,请先将其保存在本地
hive -e "select * from t1" > /home/yourfile.tsv
检查this答案。
然后将其加载到DataFrame中,如下所示:
import pandas as pd
df = pd.read_csv("/home/yourfile.tsv",delimiter = "\t")