已为我提供了一个SQL表,其中所有188列均设置为nvarchar。当通过Pandas将该表引入Python时,所有列的数据类型都变为“对象”。
我正在用Python创建机器学习模型,并且为了创建适当的功能,有必要为这些列提供适当的数据类型。例如数字列应为INT
我会注意到,我无法修改SQL表,因此我不得不将数据固定在python中。
不是一种一一对应地为188列分配数据类型,而是可以基于列中的数据自动分配数据类型吗?
答案 0 :(得分:0)
执行此操作的方式可能更Python化,但是其他语言之间的通用模式是使用try/catch
测试将值转换为不同类型,直到成功为止。例如,try
将其转换为日期,然后将catch
转换为适当的异常(通常为ValueError
)。重复以转换为int以及任何其他数据类型。
例如,下面的代码将测试pass
和int
数据类型:
float