我正在扫描文本文件目录,并将它们添加到Pandas数据框:
text_path = "/home/tdun0002/stash/cloud_scripts/aws_scripts/output_files/memory_stats/text/"
filelist = os.listdir(text_path)
final_df = pd.DataFrame()
for filename in filelist:
my_file = text_path + filename
try:
df = pd.read_csv(my_file, delim_whitespace=True, header=None)
final_df = final_df.append(df)
pd.options.display.max_rows
print(f"\n***Full Data Frame: {final_df}\n***")
目录中的每个文件都包含服务器的内存:
bastion001-memory.txt
permissions001-memory.txt
haproxy001-memory.txt
文件内容如下:
cat haproxy001-memory.txt
7706172
每次添加文件时,它会为每行添加一个新列,其中包含0:
***Full Data Frame:
0
0 1843260
0 1843260
0 1843260
0 1843260
0 1843260
0 1843260
0 1843260
0 1843260
0 1843260
0 3819060
0 3819060
0 7706164
0 7904828
0 7706172
0 7648524
0 7706172
***
为什么要添加仅包含零的新列?第一行中只有0
,即使它正在提取的文件都没有这样的行。
我只希望第二列中的内容在数据框中,例如:7706172