我有一个包含330k +行和12列的csv文件。我需要将第1列(数字ID)和第3列(文本字符串)放入列表或数组中,以便我可以分析第3列中的数据。
这段代码让我拿出第三个字母:
for row in csv_strings:
string1.append(row[2])
有人能指出我可以研究的正确命令类来完成工作吗?
感谢。
答案 0 :(得分:2)
Pandas是最好的工具。
import pandas as pd
df = pd.read_csv("filename.csv", usecols=[ 0, 2 ])
答案 1 :(得分:0)
points = []
for row in csv_strings:
points.append({id: row[0], text: row[2]})
您可以将它们拉出到键值对列表中。
答案 2 :(得分:0)
一个不同的答案,使用元组,确保不变性并且非常快,但不如字典方便:
# build results
results = []
for row in csv_lines:
results.append((row[0], row[2]))
# Read results
for result in results:
result[0] # id
result[1] # string
答案 3 :(得分:-1)
import csv
x,z = [],[]
csv_reader = csv.reader(open('Data.csv'))
for line in csv_reader:
x.append(line[0])
z.append(line[2])
这可以帮助您从第1列和第3列获取数据