如何在熊猫数据框中打印并保存查询结果

时间:2018-12-22 01:59:27

标签: python python-3.x

我正在尝试使用python连接到远程Hive群集。我尝试了pyhive,pyhs2,但没有成功。使用下面的代码,我可以连接到蜂巢,但是如何将结果打印并保存到熊猫数据框中?

我尝试了以下几行,没有任何运气: out = stdout.read() 打印stdout.read()

import os
import paramiko


ssh = paramiko.SSHClient()
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
ssh.load_host_keys(os.path.expanduser(os.path.join("~", ".ssh", "known_hosts")))
ssh.connect('00.00.00.00.', username='******', password='*******')
sshin, sshout, ssherr= ssh.exec_command('hive -e "select * from t1"')

我要打印结果并将其保存在熊猫数据框中。

1 个答案:

答案 0 :(得分:0)

如果您打算将结果加载到熊猫DataFrame中,请先将其保存在本地

hive -e "select * from t1" > /home/yourfile.tsv

检查this答案。

然后将其加载到DataFrame中,如下所示:

import pandas as pd
df = pd.read_csv("/home/yourfile.tsv",delimiter = "\t")