使用熊猫读取具有可变类型列的Excel

时间:2019-02-13 21:09:25

标签: python excel pandas

我正在为提供给系统的Excel数据集自动化后端Python数据处理。其中一列的格式应为包含字母数字字符以及连字符('-')和句点('。')分隔符的文本。

Excel正在自动设置此列的格式,并转换两个以连字​​符分隔的数字值作为日期。因此,当我尝试使用read_excel()加载Pandas库时,它正在使用Excel格式并导致不良行为。

例如:2019年4月5日输入为“ 4-5”会自动转换为“ 5-Apr”,但我希望它保持为“ 4-5”。当然,我可以手动打开文件,然后将列更改为文本,但这无法实现完全自动化的目标。

使用pandas.read_excel(),该列为dtype = object。我尝试将其转换为str,但它仅保留excel格式。然后我尝试将其转换为int后跟str,但是字母字符引发错误。

是否可以在Python中的原始Excel文件上执行此操作,还是我需要要求数据源的所有者强制执行所需的格式?

0 个答案:

没有答案