我在数据帧中使用数字列进行简单查找,但是其中一条记录包含空格,这使查找受了限制。下面只是实际文件中的示例列。
Column
90043
216977
98207
记录两个216977
是一个后跟3个空白的地方。我尝试使用strip()
和apply(lambda x: x.strip())
,但不幸的是,它们不适用于数字列。任何人都可以建议我在这里做错了什么。提前致谢。
答案 0 :(得分:0)
如果其中一个字段有空格,则可能是一个数字存储为字符串。您可以尝试将类型强制转换为int。
df = pd.DataFrame([[1],['2 '],[3]], columns=['Messy Data'])
df
Messy Data
0 1
1 2
2 3
现在使用apply&lambda将所有内容强制转换为int
df['Messy Data'] = df['Messy Data'].apply(lambda x: int(x))
df
Messy Data
0 1
1 2
2 3