在aws中使用时出现pd.read_json错误

时间:2017-12-14 19:08:50

标签: python json pandas amazon-web-services valueerror

我是aws和json文件的新手。我正在尝试使用代码读取aws中的json文件:pd.read_json('train.json')但我收到了ValueError消息:

ValueError:解码数组值(2)时发现意外字符

json文件是从kaggle competitiontion:https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data下载的。有两列是图像数据,有些像这样的数字“-27.878360999999998”

我在本地计算机上运行时没有收到任何错误消息。在aws实例中(深度学习AMI -Amazon Linux - 2-0),我尝试使用绝对路径,但它不起作用。有一点是,我可以读取其他json文件在该实例中使用相同的代码行。只是无法用长数字读取这个json文件。

这是数据的样子,我在本地计算机上获取数据帧。

'train.json' to dataframe

服务器中的python,pandas是与本地计算机相同或更新的版本。

提前致谢。

1 个答案:

答案 0 :(得分:0)

我遇到了同样的问题,我发现的解决方法是:

  1. 使用任何解压缩工具提取json.7z文件。
  2. 这里将提取文件:'processed / data / train.json'。 在我的AWS AMI上使用pandas打开时,此文件有效。
  3. 希望这有帮助。