我正在尝试使用pandas在Python中导入分号分隔的巨大.txt文件。该文件没有固定的列长度。这不允许我正确导入数据。我尝试了以下方法,但似乎这不起作用。有人可以提出一个简单的替代方法来克服它吗?
#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
#dataset = pd.read_table('a.txt' , sep = ';' , header=None)
df = pd.DataFrame()
with open('a.txt', 'r') as f:
for line in f:
df = pd.concat( [df, pd.DataFrame([tuple(line.strip().split(';'))])], ignore_index=True )
答案 0 :(得分:1)
这可能对你有用。没有数据的例子就不可能测试......
#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#Loading the .txt file
df = pd.read_csv('a.txt' , sep=';' , header=None)
答案 1 :(得分:0)
您的数据不是表格式的,不适合pandas DataFrame。例如,前两行是:
$hasil_cek = $this->model_dosen->cek_nip($nip);
其中一个有三个字段,另一个有两个字段。 pandas DataFrames是为表格数据而设计的,其中每一行的列数相同,每列的行数相同。