如何处理在 Pandas DataFrame 中出现的字符串,如整数、浮点数或日期时间?

时间:2021-08-01 13:39:50

标签: python pandas dataframe

我有一个包含字符串对象的 DataFrame,这些对象表现为整数、日期时间和浮点数。

我的 DataFrame 的外观:

   A    B      C        D        E.....................φ
1-Int  NaN  Str Obj  Datetime   NaN...............Mixed Obj
2-NaN Float Str Obj  Datetime Category................NaN
3-Int Float   NaN    Datetime Category............Mixed Obj
.  .   .       .         .       .                     .
.  .   .       .         .       .                     .
.  .   .       .         .       .                     .
Z-Int Float Str Obj     NaN   Category............Mixed Obj

它的实际内容和结构:

   A         B       C        D         E.....................φ
1-Str Obj   NaN    Str Obj  Str Obj   Str Obj............Mixed Obj
2-  NaN    Str Obj Str Obj  Str Obj   Str Obj................NaN
3-Str Obj  Str Obj  NaN     Str Obj   Str Obj............Mixed Obj
.    .        .       .        .         .                    .
.    .        .       .        .         .                    .
.    .        .       .        .         .                    .
Z-Str Obj  Str Obj Str Obj    NaN     Str Obj............Mixed Obj

我尝试访问字符串对象以查看是否可以更改它们:

df = df.select_dtypes(includes='object').where(~(r'\d+\\\\\d+\\\\\d+'), datetime)

我想看看是否可以检测日期时间字符串并将字符串值转换为日期时间值。我这样做没有成功,因为 where 方法不接受字符串作为条件。如何检测字符串中包含的日期时间、整数或浮点数,并将它们从字符串对象更改为正确的类型?

0 个答案:

没有答案