我见过一些关于如何将文件读入数据框的网站,但找不到一个教我如何读取使用soh来分割数据的文件的网站。
我得到的文件没有扩展名,但它们看起来像.txt文件。
现在我逐行读取文件来创建数据帧,这需要很多时间。有没有办法让它更快?
from pandas import DataFrame
openfile = open('filename','r')
column1 = []
column2 = []
for line in openfile:
line = line.strip().split('\x01') #soh equals to '\x01'
column1.append(line[0])
column2.append(line[1])
data = {'column1':column1, 'column2':column2}
table = DataFrame(data,columns = ['column1','column2'])
答案 0 :(得分:0)
如果您的数据没有标题,则应该这样做:
import pandas as pd
table = pd.read_table('filename', sep='\x01', header=None, names=['column1','column2'])
您可以更多地了解阅读文件here。