如何通过SSH在Python / Pandas中读取HDF5文件?

时间:2019-04-21 21:37:55

标签: pandas ssh path putty hdf

我正在通过SSH(Putty)访问远程计算机。数据集存储在该计算机上的目录中,我需要在本地计算机上使用Python在熊猫中读取该数据集。我正在尝试使用dataframe=pandas.read_hdf(path, key="data"),但是我不知道指定哪个路径将直接指向本地Python代码中存储在远程计算机上的数据集,因为它不在本地存储。正如我提到的,我正在使用Putty访问数据集。 路径应该是什么样的? 我尝试将C:替换为主机名,后跟在Putty中用于访问文件的路径。

谢谢。

1 个答案:

答案 0 :(得分:0)

我不知道您所说的确切含义是什么,但是可以使用以下内容显示数据框:

  1. SSH到您的远程服务器
  2. 导航到数据框存储在的目录: cd /directory/of/dataframe
  3. 启动Python或iPython解释程序:pythonipython
  4. 执行这些python命令:
>>> import pandas as pd
>>> dataframe=pandas.read_hdf("hdf_file.h5", key="data")
# This should work because `hdf_file.h5 is 
# in the directory you launched the python command
  1. 打印数据框:print(dataframe)