在我的工作中,我发现了一个奇怪的现象。 1.我将数据从json文件解析为csv文件,json文件中的数据类型为字符串, 我使用pd.to_csv()将数据写入csv文件。 2.我使用csv文件进行统计,发现某些列的值的数据类型是字符串,在此列中也发现:某些值是字母(我记录了)。 所以我想这就是该列数据类型为字符串的原因。
我的猜测正确吗? 在我的json文件中:在某些json文件中,某些项目没有值,但是在其他json文件中的同一项目有值,因此我使用字符串来记录它的值 在我随后的计算中,这变得特别麻烦。 我想知道该如何处理它们以避免这些问题?
df.select_dtypes(include ='number') pd.to_numeric()
self._raw_df.select_dtypes(include='number')
pd.to_numeric(df['item'],errors='coerce')