Python&熊猫 - 使用chr(255)作为分隔符

时间:2017-11-02 13:55:32

标签: python pandas

我正在尝试使用Python和&解析防火墙日志。熊猫但我遇到了让正确的分隔符工作的问题;

在我当前的日志数据中:

num�date�time�orig�type�action�alert�i/f_name�i/f_dir�product�log_sys_message�origin_id�ProductFamily�src�dst�proto�message_info�service�s_port�rule�rule_uid�rule_name�service_id�xlatesrc�xlatedst�NAT_rulenum�NAT_addtnl_rulenum�xlatedport�xlatesport�ICMP�ICMP Type�ICMP Code�rule_guid�hit�policy�first_hit_time�last_hit_time�log_id�description�status�version�comment�update_service�TCP packet out of state�tcp_flags�sys_message:�inzone�outzone�Protection Name�Severity�Confidence Level�protection_id�SmartDefense Profile�Performance Impact�Industry Reference�Protection Type�Update Version�Attack Info�attack�capture_uuid�FollowUp�Total logs�Suppressed logs
0�24Oct2017�23:59:00�10.100.255.190�control� ��daemon�inbound�VPN-1 & FireWall-1�Log file has been switched to: 2017-10-24_235900.log�cteafmfw1�Network��������������������������������������������������

和代码:

import pandas as pd

file = pd.read_csv('2017-10-25_235900.log-export.csv', sep='\xff', 
header=0, index_col=False)

print(file)

当我运行这个时,我可以看到分隔符没有被处理;我已经尝试将其分配给值为chr(255)的变量,就像提出的类似问题一样,但似乎无法让这个分隔符完全被抛出。

我知道我可以处理文件并替换分隔符,但由于此分隔符有大量数据已经很高兴知道是否可以使其工作?

1 个答案:

答案 0 :(得分:0)

对于其他想知道的事情:

将“encoding ='latin-1'”添加到read_csv params解决了这个问题

谢谢@ COLDSPEED