我试图将10,000+列的数据帧转换为整数。我有一个循环遍历每一列的函数,并将它们逐个转换为整数。这有效,但需要很长时间才能完成。功能:
def convert_to_int(dataframe, all_cols):
for column in all_cols:
try:
dataframe[column] = dataframe[column].astype(int)
except (ValueError, OverflowError):
pass
return dataframe
是否有一个命令可以更快地完成此操作?我尝试过pd.to_numeric并忽略错误,但大多数列都没有转换为整数。有什么想法吗?
编辑:为我的数据提供一些见解;我的几乎所有列都是数字的,但有很多数值实际上是字符串。我的许多列都是二进制的,因此它们包含值0, 1, '1', '0'
。这些字符串必须转换为整数。