应用错误收集

在我的工作中，我发现了一个奇怪的现象。 1.我将数据从json文件解析为csv文件，json文件中的数据类型为字符串，我使用pd.to_csv（）将数据写入csv文件。 2.我使用csv文件进行统计，发现某些列的值的数据类型是字符串，在此列中也发现：某些值是字母（我记录了）。所以我想这就是该列数据类型为字符串的原因。

我的猜测正确吗？在我的json文件中：在某些json文件中，某些项目没有值，但是在其他json文件中的同一项目有值，因此我使用字符串来记录它的值在我随后的计算中，这变得特别麻烦。我想知道该如何处理它们以避免这些问题？

df.select_dtypes（include ='number'） pd.to_numeric（）

self._raw_df.select_dtypes(include='number')
pd.to_numeric(df['item'],errors='coerce')

将json文件解析为csv文件时如何处理数据类型

0 个答案: