读取TXT或CSV或XLS或XLSX的第一列

时间:2018-06-21 08:19:30

标签: python excel csv xlsx xls

我需要将文档的第一列解析为列表email,该文档可以是:

  • TXT文档(由换行符分隔的项目)
  • 只有一列的CSV文档(与TXT文档类似)
  • 具有许多列的CSV,以['item1', 'item2', ...]分隔
  • 具有许多列的CSV,以;分隔
  • 具有一列或多列的XLS
  • 具有一列或多列的XLSX

在许多情况下,我都会编写代码:

,

但是 Python中是否有一个通用的高级工具可以直接完成所有这些工作?

1 个答案:

答案 0 :(得分:1)

pyexcel库非常高级,需要使用一致的接口处理不同格式的数据文件:

  

pyexcel 提供了一个应用程序编程界面,用于读取,   以不同的excel格式处理和写入数据。这个图书馆   使涉及excel文件的信息处理成为一项令人愉快的任务。   excel文件中的数据最少可以转换为数组或字典   代码,反之亦然。该库专注于使用excel进行数据处理   文件作为存储介质,因此字体,颜色和图表不是   将不会被考虑。

一个简单的用法示例为:

>>> import pyexcel as pe
>>> records = pe.iget_records(file_name="your_file.xls")
>>> for record in records:
...     print("%s is aged at %d" % (record['Name'], record['Age']))