Question

我正在尝试使用pandas在Python中导入分号分隔的巨大.txt文件。该文件没有固定的列长度。这不允许我正确导入数据。我尝试了以下方法，但似乎这不起作用。有人可以提出一个简单的替代方法来克服它吗？

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

#Loading the .txt file
#dataset = pd.read_table('a.txt' , sep = ';' , header=None)

df = pd.DataFrame()

with open('a.txt', 'r') as f:
    for line in f:
        df = pd.concat( [df, pd.DataFrame([tuple(line.strip().split(';'))])], ignore_index=True )

Answer 1

这可能对你有用。没有数据的例子就不可能测试......

#import libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

#Loading the .txt file
df = pd.read_csv('a.txt' , sep=';' , header=None)

Answer 2

您的数据不是表格式的，不适合pandas DataFrame。例如，前两行是：

$hasil_cek = $this->model_dosen->cek_nip($nip);

其中一个有三个字段，另一个有两个字段。 pandas DataFrames是为表格数据而设计的，其中每一行的列数相同，每列的行数相同。

使用pandas在Python中导入分号分隔的.txt文件

2 个答案: