检查数据系列是否为字符串

时间:2017-04-03 18:28:53

标签: python pandas

我想检查数据框中的列是否包含字符串。我原以为这可以通过检查dtype来完成,但事实并非如此。包含字符串的pandas系列只有dtype'object',它也用于其他数据结构(如列表):

df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello', '1', '2'], 'c': [[1],[2],[3]]})

df = pd.DataFrame({'a': [1,2,3], 'b': ['Hello', '1', '2'], 'c': [[1],[2],[3]]})
print(df['a'].dtype)
print(df['b'].dtype)
print(df['c'].dtype)

产地:

int64
object
object

有没有办法检查列是否只包含字符串?

2 个答案:

答案 0 :(得分:8)

您可以使用它来查看列中的所有元素是否为字符串

df.applymap(type).eq(str).all()

a    False
b     True
c    False
dtype: bool

只检查是否有字符串

df.applymap(type).eq(str).any()

答案 1 :(得分:1)

您可以使用将所有元素转换为True或False的函数映射数据(如果它们是否等于str-type),那么只需检查列表是否包含任何False元素

下面的示例测试包含除了str之外的元素的列表。如果存在其他类型的数据,它会告诉您True

test = [1, 2, '3']
False in map((lambda x: type(x) == str), test)

输出:True