试图确定列条目的大多数dtype是什么。我正在自动执行一个数据帧处理功能,该功能确定一个对象类是否充满strings
或充满int or float
但其中没有未知的strings
。我知道,只要键入以下内容,就可以识别该列的数据类型,但是条目呢。
import pandas as pd
df = pd.read_csv('data.csv')
df.dtypes
输出
Name object
Age object
dtype: object
识别列是否被错误标记的最佳方法是什么?示例数据在这里
df.Age
Out[25]:
0 25
1 23
2 24
3 26
4 30
5 18
6 22
7 19
8 23
9 20
10 Refused
11 23
12 29
Name: Age, dtype: object
答案 0 :(得分:2)
您只能通过DataFrame.select_dtypes
查看对象列(显然是strings
),然后尝试将转换为to_numeric
的参数为errors='coerce'
的操作-它将不能解析的值转换为{{1} },因此请测试至少Series.notna
和Series.any
中的一个非NaN
:
NaN