如何创建" clean"来自CSV文件的数据表

时间:2017-04-17 10:42:12

标签: python csv

我开始使用Python中的CSV文件,我想学习如何正确操作它们。我想了解如何管理大量数据,例如此{CSV}文件Sacramento Crime January 2006中有7,548条犯罪记录。

基本上我想将它变成一个包含第一行作为标题(名称,ID,纬度等)以及其下所有其他值的表。我使用了这个问题的代码which is similar to mine but does not work entirely

根据这个问题,我应该有标题的名称,后跟其内容,但我得到:

{'address': [], 'etc': []} []

当我得到{{'adress':[]]} ['addresses in CSV file( 7k etc)']

当我希望它看起来像

时,它也在一行中
Name ID Latitude etc
John 55 -4.56777 etc

虽然我的所有CSV文件都是这样的:

cdatetime,address,district,beat,grid,crimedescr,ucr_ncic_code,latitude,longitude
1/1/06 0:00,3108 OCCIDENTAL DR,3,3C     

目前我只研究了相关问题答案中的内容,但我一直在苦苦寻找方法。顺便说一下,我是Python的新手,就像我刚刚学会了如何打开,读取,写入文件等。 我也应该使用import pandasimport csv。哪个更好?

1 个答案:

答案 0 :(得分:1)

我找到了解决问题的方法。比我想象的要简单得多,使用大熊猫。我不知道它对于操作CSV文件是如此有用。

import pandas as pd

path=("path to csv file")
table= pd.read_csv(path, header='infer', sep=',')
print(table)

您可能需要更改分隔符,根据您的文件,您可能需要更改标题的值(0infer是默认值)。这是以下结果

cdatetime           adress        district beat   etc.
1/1/06 0:00    3108 OCCIDENTAL DR      3      3C  etc.