将文件读入pandas数据帧(使用soh分割数据)

时间:2017-05-30 09:30:38

标签: python pandas dataframe

问题:

我见过一些关于如何将文件读入数据框的网站,但找不到一个教我如何读取使用soh来分割数据的文件的网站。

我得到的文件没有扩展名,但它们看起来像.txt文件。

现在我逐行读取文件来创建数据帧,这需要很多时间。有没有办法让它更快?

代码:

from pandas import DataFrame 
openfile = open('filename','r')
column1 = []
column2 = []
for line in openfile:
    line = line.strip().split('\x01') #soh equals to '\x01'
    column1.append(line[0])
    column2.append(line[1])
data = {'column1':column1, 'column2':column2}
table = DataFrame(data,columns = ['column1','column2'])

1 个答案:

答案 0 :(得分:0)

如果您的数据没有标题,则应该这样做:

import pandas as pd
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2'])

您可以更多地了解阅读文件here