我正在处理包含8列和数千行的excel文件中的数据清理。我在某些栏目中遇到了一些问题,即让分,得分和 HT 。我将解释我所面临的每个问题的细节。某些“ 障碍”列中的数据类型(行值)是混合的。例如, Hapdicap 列中的数据格式如下:
这意味着当我在excel单元格中按F2时,可以看到公式= 0 / 0.5和= -1 / -1.5。当我将其加载到熊猫时,它显示0和0.666667。
我想做的是加载为0 / 0.5和-1 / -1.5之类的字符串。
我的第二个问题是在得分和 HT 列中。 Excel将识别为日期。它应该显示1-1,但在单元格中显示为01-Jan。我想将这些单元格转换为1-1格式
我很难创建示例数据框。因此,我提取了一些样本数据。您可以通过点击the link来下载它。
我还附加并突出显示了要更改的部分,如下所示:
非常感谢您提出的建议。
谢谢。
此致
Zep。