当数据不均匀时,每行中的列数不同,如何选择多列

时间:2019-07-02 10:56:54

标签: python pandas csv

请帮助我,因为我是新手,我们将不胜感激任何人的帮助。 我需要对数据进行排序以进行进一步的实现和处理。 有一个包含超过150万个数据条目的csv文件。 我需要对数据进行排序,因为大约有130万行,并且每行中的列数不同。 有些包含49列,有些包含45列,依此类推... 我只需要对每行中排列在不同列编号位置的这些列进行排序-日期,时间,操作,dstcountry,dstip,dstport,rcvdbyte,sendbyte,服务,srcip,transip

我尝试对列进行计数并直接在Linux中使用cut命令,但输出结果是一些原始值和无用的列。

我尝试使用Python来实现它,但是它也没有用。

devid=FG5H0E3917902138,vd=root,type=traffic,subtype=forward,action=close,appcat=unscanned,devcategory=None,devname=CEERI-FGT-500E,devtype=Router/NATDevice,dstcountry=UnitedStates,dstintf=port10,dstintfrole=wan,dstip=172.217.166.14,dstport=443,dtime=1555678087,duration=2,eventtime=1555658287,level=notice,logid=0000000013,logver=60,mastersrcmac=64:9e:f3:62:f3:7f,policyid=11,policytype=policy,poluuid=3006651e-3982-51e8-f992-75390476fffc,proto=6,rcvdbyte=7670,rcvdpkt=14,sentbyte=2676,sentpkt=12,service=HTTPS,sessionid=246381988,srccountry=Reserved,srcintf=port9,srcintfrole=lan,srcip=192.168.2.233,srcmac=64:9e:f3:62:f3:7f,srcport=56548,srcserver=0,trandisp=snat,transip=14.139.59.45,transport=56548,
devid=FG5H0E3917902138,vd=root,type=traffic,subtype=forward,action=accept,app=Google.Services,appcat=General.Interest,appid=42533,applist=P2P,apprisk=elevated,devcategory=None,devname=CEERI-FGT-500E,devtype=Router/NATDevice,dstcountry=India,dstintf=port4,dstintfrole=wan,dstip=216.58.196.202,dstport=443,dtime=1555678087,duration=240,eventtime=1555658287,level=notice,logid=0000000020,logver=60,mastersrcmac=64:9e:f3:62:f3:7f,policyid=12,policytype=policy,poluuid=35a6a75e-3982-51e8-3f94-2faa48865ed8,proto=6,rcvdbyte=4997,rcvddelta=4997,rcvdpkt=11,sentbyte=2446,sentdelta=2446,sentpkt=12,service=HTTPS,sessionid=246365216,srccountry=Reserved,srcintf=unknown-0,srcintfrole=undefined,srcip=192.168.9.152,srcmac=64:9e:f3:62:f3:7f,srcport=47367,srcserver=0,trandisp=snat,transip=14.139.59.35,transport=47367,

这是我正在处理的数据的一部分。

0 个答案:

没有答案