我有以下示例.csv
文件:
str_header int_header
string_a 1
string_b 2
string_c 3
根据互联网上的解决方案,此代码:
import pandas as pd
data = pd.read_csv("z.csv", names=['int_header'])
print(data['int_header'])
只应将int_header
列读入data
。但是data
,如上所述,实际上包含所有文件列。我正在使用Anaconda的Python发行版。怎么了?
答案 0 :(得分:5)
试试这个:
data = pd.read_csv("z.csv", usecols=['int_header'])
假设您的CSV文件有,
作为分隔符
说明:
名称:类似数组,默认无
要使用的列名列表。如果是文件 不包含标题行,那么您应该显式传递header = None
usecols:类似数组,默认为无
返回列的子集。结果>更快的解析时间和更低的内存使用率。
文档有点令人困惑。
names
- 用于命名(给出列名),特别是如果您没有标题行或想忽略/跳过它。
usecols
- 仅用于选择“有趣”列