我想检查数据框中的列是否包含字符串。我原以为这可以通过检查dtype来完成,但事实并非如此。包含字符串的pandas系列只有dtype'object',它也用于其他数据结构(如列表):
df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello', '1', '2'], 'c': [[1],[2],[3]]})
df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello', '1', '2'], 'c': [[1],[2],[3]]})
print(df['a'].dtype)
print(df['b'].dtype)
print(df['c'].dtype)
产地:
int64
object
object
有没有办法检查列是否只包含字符串?
答案 0 :(得分:8)
您可以使用它来查看列中的所有元素是否为字符串
df.applymap(type).eq(str).all()
a False
b True
c False
dtype: bool
只检查是否有字符串
df.applymap(type).eq(str).any()
答案 1 :(得分:1)
您可以使用将所有元素转换为True或False的函数映射数据(如果它们是否等于str-type),那么只需检查列表是否包含任何False
元素
下面的示例测试包含除了str之外的元素的列表。如果存在其他类型的数据,它会告诉您True
test = [1, 2, '3']
False in map((lambda x: type(x) == str), test)
输出:True