在我的研究工作中,我有多个文本文件,具有共同的字符串“ Max”,并且Max在0.10到2.00的范围内具有不同的值,步骤0.10如下:
A_100Hz_Rate20Hz_5tot_0.10Max_1_
A_100Hz_Rate20Hz_5tot_0.10Max_2_
A_100Hz_Rate20Hz_5tot_0.10Max_3_
.
.
.
A_100Hz_Rate20Hz_5tot_2.00Max_1_
A_100Hz_Rate20Hz_5tot_2.00Max_2_
A_100Hz_Rate20Hz_5tot_2.00Max_3_
我需要根据Max的值(例如:0.10Max)导入所有文件,以分别获取具有相同Max值的文件的平均值,以获得:
Ave_A_100Hz_Rate20Hz_5tot_0.10Max_3_
.
.
.
Ave_A_100Hz_Rate20Hz_5tot_2.00Max_3_
我尝试了一个手动Glob模块,它对于一个“ Max”值工作正常,但是对于整个范围它却不起作用。这是我的代码:
import numpy as np
import glob
import pandas as pd
h = np.linspace(0.10,2.00,20)
for x in h:
x1 = ("%.2f" % x)
glob_path = 'input/*_{}Vbr_*.txt'.format(x1)
import_files = glob.glob(glob_path)
print(x,import_files )
for index, file_name in enumerate(import_files ):
merged_data = pd.read_csv(file_name, header=None, delimiter="\t").values
if index==0:
summation = merged_data
else:
summation = summation + merged_data
averaging = summation/len(import_files)
np.savetxt('output/Ave_'+file_name[10:], averaging, delimiter="\t" )
我需要编写一个通用脚本。但是,就我而言,现在我只使用两个值x = 1.50和x = 2.0的脚本来简化脚本。我尝试了print(import_files)并期望输出为:
['input\\A_100Hz_Rate20Hz_5tot_1.50Max_1_.txt',
'input\\A_100Hz_Rate20Hz_5tot_1.50Max_2_.txt',
'input\\A_100Hz_Rate20Hz_5tot_1.50Max_3_.txt']
['input\\A_100Hz_Rate20Hz_5tot_2.00Max_1_.txt',
'input\\A_100Hz_Rate20Hz_5tot_2.00Max_2_.txt',
'input\\A_100Hz_Rate20Hz_5tot_2.00Max_3_.txt']
但是实际的输出是(简而言之):
0.1 []
0.2 []
1.5 ['input\\A_100Hz_Rate20Hz_5tot_1.50Max_1_.txt',
'input\\A_100Hz_Rate20Hz_5tot_1.50Max_2_.txt',
'input\\A_100Hz_Rate20Hz_5tot_1.50Max_3_.txt']
1.6 []
1.7 []
2.0['input\\A_100Hz_Rate20Hz_5tot_2.00Max_1_.txt',
'input\\A_100Hz_Rate20Hz_5tot_2.00Max_2_.txt',
'input\\A_100Hz_Rate20Hz_5tot_2.00Max_3_.txt']
它导致了内核错误
np.savetxt('output/Ave_'+file_name[10:], averaging, delimiter="\t" )
NameError: name 'file_name' is not defined
请问,有什么建议吗?
答案 0 :(得分:2)
我认为您只需要测试import_file
是否为空:
for x in h:
x1 = ("%.2f" % x)
glob_path = 'input/*_{}Vbr_*.txt'.format(x1)
import_files = glob.glob(glob_path)
print(x,import_files )
if len(import_files) != 0:
for index, file_name in enumerate(import_files ):
merged_data = pd.read_csv(file_name, header=None, delimiter="\t").values
if index==0:
summation = merged_data
else:
summation = summation + merged_data
averaging = summation/len(import_files)
np.savetxt('output/Ave_'+file_name[10:], averaging, delimiter="\t" )