Question

从S3读取CSV时，内核正在重新启动，弹出如下：

Kernel Restarting
The kernel appears to have died. It will restart automatically

以下是代码段：

import boto3
import pandas as pd
from boto.s3.connection import S3Connection

YOUR_ACCESS_KEY='******'
YOUR_SECRET_KEY='******'
YOUR_BUCKET='******'

client = boto3.client('s3',aws_access_key_id=YOUR_ACCESS_KEY, aws_secret_access_key=YOUR_SECRET_KEY)
client.download_file(YOUR_BUCKET, 'test.csv','test.csv')

从以下行引发错误：

test_df = pd.read_csv('test.csv')

但我可以访问其他文件，例如示例文本文件：

client.download_file(YOUR_BUCKET, 'sample.txt','sample.txt')
print(open('sample.txt').read())

我认为这个错误是因为CSV文件的大小很大，但是读取5MB的CSV文件会产生同样的错误。

Answer 1

似乎是pyTorch的错误。

https://github.com/jupyter/notebook/issues/2784

那里讨论的替代品和多种解决方案，门票仍然是开放的。

希望它有所帮助。

AWS Jupyter Notebook EC2实例：从S3

1 个答案: