在加载的Excel文件中使用df.info方法后,我得到以下数据
/
我不知道为什么所有数据类型都是对象,尽管它们大多数都有数值 如何修复我的数据集的数据类型
答案 0 :(得分:0)
尝试例如:
df['X1'] = df['X1'].astype(str).astype(int)
如果要格式化所有列,请尝试:
df = df.astype(int)
这是因为,当您导入.csv
文件时,大多数列都会转换为对象。
答案 1 :(得分:0)
让我们尝试to_numeric
df = pd.DataFrame({'1':['1','2'],'2':['a','b']})
df = df.apply(pd.to_numeric,errors='ignore')
检查
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2 entries, 0 to 1
Data columns (total 2 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 1 2 non-null int64
1 2 2 non-null object
dtypes: int64(1), object(1)
memory usage: 88.0+ bytes