我有一个要转换为数字的列的数据框,如下所示:
for col in df.columns[22:33]:
df[col] = pd.to_numeric(df[col], errors = 'coerce')
哪个效果很好。但是,只要我尝试包含多个范围,就这样:
for col in df.columns[22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89,91:94 ]:
df[col] = pd.to_numeric(df[col], errors = 'coerce')
我得到了错误,
IndexError: too many indices for array
有没有解决的办法,我希望不必针对每个范围一遍又一遍地做。谢谢。
答案 0 :(得分:2)
这是np.r_
的功能。您传入数字和切片的数组,它将把它们构造/连接到扩展数组中。
cols = np.r_[22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89,91:94]
array([22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38,
39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55,
56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 68, 69, 71, 72, 74, 75, 76,
77, 78, 81, 82, 83, 84, 85, 88, 89, 91, 92, 93])
之后,您可以将cols
用作
df.columns[cols]
答案 1 :(得分:1)
然后您必须创建2个循环。创建一个包含范围的元素的列表,然后对其进行循环,在此循环中插入原始的循环代码。
赞:
for i in range_list:
for col in df.columns[i]:
#do your code here.
您的range_list
将具有您需要的范围。
答案 2 :(得分:1)
假设目标列代表数据框中各列的整数名称(按照您的示例),则可以对字符串进行修饰并连接结果。
target_cols_str = "22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89, 91:94"
df_series = []
for col in target_cols_str.split(','):
col = col.strip() # Remove any whitespace.
if ':' in col:
lhs, rhs = col.split(':')
df_series.append(df.loc[:, int(lhs):int(rhs)])
else:
df_series.append(df.loc[:, int(col)])
df2 = pd.concat(df_series, axis=1)
应用于您的示例以将原始数据框转换为数值:
target_cols_str = "22:66, 68, 69, 71, 72, 74:79, 81:86, 88, 89, 91:94"
for col in target_cols_str.split(','):
col = col.strip() # Remove any whitespace.
if ':' in col:
lhs, rhs = col.split(':')
for col_name in range(int(lhs), int(rhs) + 1):
df.loc[:, col_name] = pd.to_numeric(df.loc[:, col_name], errors = 'coerce')
else:
df.loc[:, int(col)] = pd.to_numeric(df.loc[:, int(col)], errors = 'coerce')