我开始使用Python中的CSV文件,我想学习如何正确操作它们。我想了解如何管理大量数据,例如此{CSV}文件Sacramento Crime January 2006中有7,548条犯罪记录。
基本上我想将它变成一个包含第一行作为标题(名称,ID,纬度等)以及其下所有其他值的表。我使用了这个问题的代码which is similar to mine but does not work entirely。
根据这个问题,我应该有标题的名称,后跟其内容,但我得到:
{'address': [], 'etc': []} []
当我得到{{'adress':[]]} ['addresses in CSV file( 7k etc)']
当我希望它看起来像
时,它也在一行中Name ID Latitude etc
John 55 -4.56777 etc
虽然我的所有CSV文件都是这样的:
cdatetime,address,district,beat,grid,crimedescr,ucr_ncic_code,latitude,longitude
1/1/06 0:00,3108 OCCIDENTAL DR,3,3C
目前我只研究了相关问题答案中的内容,但我一直在苦苦寻找方法。顺便说一下,我是Python的新手,就像我刚刚学会了如何打开,读取,写入文件等。
我也应该使用import pandas
或import csv
。哪个更好?
答案 0 :(得分:1)
我找到了解决问题的方法。比我想象的要简单得多,使用大熊猫。我不知道它对于操作CSV文件是如此有用。
import pandas as pd
path=("path to csv file")
table= pd.read_csv(path, header='infer', sep=',')
print(table)
您可能需要更改分隔符,根据您的文件,您可能需要更改标题的值(0
和infer
是默认值)。这是以下结果
cdatetime adress district beat etc.
1/1/06 0:00 3108 OCCIDENTAL DR 3 3C etc.