我喜欢使用pd.read_clipboard()快速将表格数据从Excel导入到pandas中的DataFrame中。
但是,如果我在点击 CTRL + C 将其复制到剪贴板之前在Excel中突出显示了非相邻列,那么导入到我的DF中的内容将包括所有插入的列都夹在我选择复制的非相邻列之间。 (我目前正在使用Windows 10和Excel 2013)。
这很烦人且不方便。 我怀疑问题可能来自Excel或Windows剪贴板,因为当我粘贴到Sublime Text 3时,我也会得到插入(制表符分隔)的列。
如果我粘贴到一个空白工作表中,我只获得了我想要的突出显示的列,这是我的解决方法(创建一个临时Excel工作表,然后我将其复制并导入到pandas中)。这是一个不错的解决方法,但我正在寻找更快的东西,因为我每天都会在Excel和熊猫之间往返多次。
我知道如果我在复制它们之前隐藏Excel中的列(无论是通过 CTRL + 0 快捷方式还是通过对插入的列进行分组,问题就消失了想隐藏),但这些都不合适,因为它操纵我当前的Excel工作表视图/设计(无论如何Windows 10已经破坏了“取消隐藏列”的快捷方式( CTRL + SHIFT + 0 )...虽然 ALT + H + O + U + L 仍然有效。
当我不想要的插入列可见时,问题不会消失(因此,如果我点击 ALT + ; 来选择它并不重要在我点击 CTRL + C 之前,只有可见的单元格。
我正在寻找一种简单快速的解决方案,最好是在Excel中使用的替代快捷方式,或者我可以用于pd.read_clipboard()的通用kwarg。
pd.read_clipboard()的文档说要查看pd.read_table()中的关键字,但我无法弄清楚哪些可能会有所帮助。再次,我怀疑问题与Windows端的剪贴板有关,但我在网上搜索和搜索除了第三方商业Excel插件之外找不到任何东西,声称能够帮助复制非连续的单元格