我正在研究在python中实现数据挖掘算法。我有一个大的csv文件,我用它作为输入文件来获取项目集。我想通过程序将csv文件拆分成行。有人能说出如何使它成为可能吗?
答案 0 :(得分:1)
import pandas as pd
pd.read_csv(file_name,sep='rows separator')
有关详细信息,请参阅http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html。
答案 1 :(得分:0)
我假设这些行由换行符分隔,并且这些列由逗号分隔。在这种情况下,只有python已经知道如何逐行读取它,在您的情况下逐行。然后每行都可以分开,只有逗号。
item_sets=[] #Will put the data in here
with open(filename, "r") as file: # open the file
for data_row in file: #get data one row at a time
# split up the row into columns, stripping whitespace from each one
# and store it in item_sets
item_sets.append( [x.strip() for x in data_row.split(",")] )
答案 2 :(得分:0)
Type.GetInterfaces
将打印出csv文件的所有行作为列表
我假设import csv
with open('eggs.csv', 'rb') as csvfile:
spamreader = csv.reader(csvfile, delimiter=' ', quotechar='|')
for row in spamreader:
print row
的pandas impelmentation效率更高,但read_csv
模块内置于python中,所以如果你不想要任何依赖,你就可以使用它。