Question

我在.jlog文件中有一个json字符串，并希望使用python以包含列的df格式读取此文件。

我的下面的代码：

   import pandas as pd
   df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')

这给我一个错误。

---------------------------------------------------------------------------
MemoryError                               Traceback (most recent call last)
<ipython-input-20-4085b33a005e> in <module>()
----> 1 df_weblogs=pd.read_json('C:/Users/me/my_file.jlog', orient='columns')
      2 df_weblogs.head(5)

~\Anaconda\lib\site-packages\pandas\io\json\json.py in read_json(path_or_buf, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
    414         keep_default_dates=keep_default_dates, numpy=numpy,
    415         precise_float=precise_float, date_unit=date_unit, encoding=encoding,
--> 416         lines=lines, chunksize=chunksize, compression=compression,
    417     )
    418 

~\Anaconda\lib\site-packages\pandas\io\json\json.py in __init__(self, filepath_or_buffer, orient, typ, dtype, convert_axes, convert_dates, keep_default_dates, numpy, precise_float, date_unit, encoding, lines, chunksize, compression)
    464 
    465         data = self._get_data_from_filepath(filepath_or_buffer)
--> 466         self.data = self._preprocess_data(data)
    467 
    468     def _preprocess_data(self, data):

~\Anaconda\lib\site-packages\pandas\io\json\json.py in _preprocess_data(self, data)
    475         """
    476         if hasattr(data, 'read') and not self.chunksize:
--> 477             data = data.read()
    478         if not hasattr(data, 'read') and self.chunksize:
    479             data = StringIO(data)

MemoryError:

应该如何正确阅读？

如何使用熊猫在Python中读取包含json字符串的.jlog？

0 个答案: