将.log文件导入Jupyter笔记本

时间:2018-08-11 06:03:36

标签: python pandas jupyter-notebook jupyter

将.log文件导入笔记本时,我遇到一些问题。它仅适用于一些文本,但是当我尝试导入文件时,将得到无效的语法。

作品:

 file_data = """
    64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET 
    /twiki/bin/edit/Main/ouble_bounce_sender?topicparent=Main.ConfigurationVariable 
    HTTP/1.1" 401 12846
    64.242.88.10 - - [07/Mar/2004:19:03:58 -0800] "GET 
    /twiki/bin/edit/Main/Message_size_limit?topicparent=Main.ConfigurationVariable 
    HTTP/1.1" 401 12846
    206-15-133-154.dialup.ziplink.net - - [11/Mar/2004:16:33:23 -0800] "HEAD 
    /twiki/bin/view/Main/SpamAssassinDeleting HTTP/1.1" 200 0"""

df = pd.read_csv(pd.compat.StringIO(file_data), names=[0, 'hour', 2, 3], sep=':', engine='python')

 df['hour'].value_counts()

但是,当我尝试导入.log文件时,会出现语法错误。

df = pd.read_csv('/Users/john/Desktop/data_log.log'), names=[0, 'hour', 2, 3], sep=':', engine='python')

如何解决它,以便可以在.log文件中计算出10个最常见的小时数?

0 个答案:

没有答案