标签: pandas
我正在使用美国劳工统计局的数据集。我正在使用的特定表格是各种职业的工资数据。当一个特定的职业没有工资数据时,他们使用星号(即*)使该列成为数字和*的组合。
这会导致pandas将列转换为dtype=object并且所有数字都成为字符串。我的工作是当我需要使用数字时将它们转换为float(),但这似乎仍然会产生不必要的前期内存分配。我在这里的想法是否正确?如果是这样,有没有人有任何关于如何改善这一点的建议?
dtype=object