我有一个包含字符串对象的 DataFrame,这些对象表现为整数、日期时间和浮点数。
我的 DataFrame 的外观:
A B C D E.....................φ
1-Int NaN Str Obj Datetime NaN...............Mixed Obj
2-NaN Float Str Obj Datetime Category................NaN
3-Int Float NaN Datetime Category............Mixed Obj
. . . . . . .
. . . . . . .
. . . . . . .
Z-Int Float Str Obj NaN Category............Mixed Obj
它的实际内容和结构:
A B C D E.....................φ
1-Str Obj NaN Str Obj Str Obj Str Obj............Mixed Obj
2- NaN Str Obj Str Obj Str Obj Str Obj................NaN
3-Str Obj Str Obj NaN Str Obj Str Obj............Mixed Obj
. . . . . . .
. . . . . . .
. . . . . . .
Z-Str Obj Str Obj Str Obj NaN Str Obj............Mixed Obj
我尝试访问字符串对象以查看是否可以更改它们:
df = df.select_dtypes(includes='object').where(~(r'\d+\\\\\d+\\\\\d+'), datetime)
我想看看是否可以检测日期时间字符串并将字符串值转换为日期时间值。我这样做没有成功,因为 where 方法不接受字符串作为条件。如何检测字符串中包含的日期时间、整数或浮点数,并将它们从字符串对象更改为正确的类型?