在读取文本文件到pandas数据框时,我该怎么做才能排除第一列并读取它
目前正在使用的代码:
dframe_main =pd.read_table('/Users/ankit/Desktop/input.txt',sep =',')
答案 0 :(得分:3)
在您阅读之后删除该列是否足够?这在功能上与从读取中排除第一列相同。这是一个玩具示例:
import numpy as np
import pandas as pd
data = np.array([[1,2,3,4,5], [2,2,2,2,2], [3,3,3,3,3], [4,4,3,4,4], [7,2,3,4,5]])
columns = ["one", "two", "three", "four", "five"]
dframe_main = pd.DataFrame(data=data, columns=columns)
print "All columns:"
print dframe_main
del dframe_main[dframe_main.columns[0]] # get rid of the first column
print "All columns except the first:"
print dframe_main
输出是:
All columns:
one two three four five
0 1 2 3 4 5
1 2 2 2 2 2
2 3 3 3 3 3
3 4 4 3 4 4
4 5 2 3 4 5
All columns except the first:
two three four five
0 2 3 4 5
1 2 2 2 2
2 3 3 3 3
3 4 3 4 4
4 2 3 4 5
答案 1 :(得分:3)
我建议使用usecols参数:
usecols :类似数组,默认无返回列的子集。
导致更快的解析时间和更低的内存使用量。
假设您的文件有5列:
In [32]: list(range(5))[1:]
Out[32]: [1, 2, 3, 4]
dframe_main = pd.read_table('/Users/ankit/Desktop/input.txt', usecols=list(range(5))[1:])