我有一个大的csv我试图读入h2o并训练基于的模型。当h2o解析大型csv虽然我的程序不断崩溃并给我这个奇怪的http 500错误,我不知道如何解释。
导致崩溃的代码行是:
data = h2o.import_file("data/Data_Labeled.csv", col_types=col_types)
但是当代码运行并到达此行时,它看起来几乎完成了解析文件,然后崩溃并跟随以下跟踪:
Traceback (most recent call last):
File "vairal.py", line 12, in <module>
bb.train_model()
File "/Users/mark/Desktop/vairal/vairal/reddit_model.py", line 15, in train_model
data = h2o.import_file("data/Data_Labeled.csv", col_types=col_types)
...
File "/Users/mark/Downloads/myenv2/lib/python2.7/site-packages/h2o/backend/connection.py", line 730, in _process_response
raise H2OServerError("HTTP %d %s:\n%r" % (status_code, response.reason, data))
h2o.exceptions.H2OServerError: HTTP 500 Server Error:
u'<html>\n<head>\n<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1"/>\n<title>Error 500 Server Error</title>\n</head>\n<body>\n<h2>HTTP ERROR: 500</h2>\n<p>Problem accessing /3/Frames/Reddit_Data_Labeled.hex. Reason:\n<pre> Server Error</pre></p>\n<hr /><i><small>Powered by Jetty://</small></i>\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n \n</body>\n</html>\n'
我知道这意味着什么并且会喜欢某些背景。我无法判断csv的格式化是否在某处或者是否因为我的计算机无法处理解析而崩溃 - 无论哪种方式,崩溃消息对我来说都没有用。
感谢任何帮助!