大型CSV操作

时间:2013-10-31 13:46:43

标签: csv command-line fastercsv

我有一个非常大的CSV文件(超过1亿条记录),我想从中删除几列。我已尝试过CSVed(http://csved.sjfrancke.nl/#csvuni)应用程序,但此大小的文件无法打开。有人知道我需要进入命令行界面删除特定列吗?我使用的是Windows 7。

以下是我目前拥有的专栏。我在要删除的列旁边放了一个“X”。

  1. 则domainName
  2. 注册商名称 - X
  3. contactEmail - X
  4. whoisServer - X
  5. nameServers - X
  6. createdDate - X
  7. updatedDate - X
  8. expiresDate - X
  9. standardRegCreatedDate - X
  10. standardRegUpdatedDate - X
  11. standardRegExpiresDate - X
  12. 状态 - X
  13. Audit_auditUpdatedDate - X
  14. registrant_email
  15. registrant_name
  16. registrant_organization
  17. registrant_street1
  18. registrant_street2
  19. registrant_street3
  20. registrant_street4
  21. registrant_city
  22. registrant_state
  23. registrant_postalCode
  24. registrant_country
  25. registrant_fax - X
  26. registrant_faxExt - X
  27. registrant_telephone
  28. registrant_telephoneExt
  29. administrativeContact_email
  30. administrativeContact_name
  31. administrativeContact_organization
  32. administrativeContact_street1
  33. administrativeContact_street2
  34. administrativeContact_street3
  35. administrativeContact_street4
  36. administrativeContact_city
  37. administrativeContact_state
  38. administrativeContact_postalCode
  39. administrativeContact_country
  40. administrativeContact_fax - X
  41. administrativeContact_faxExt - X
  42. administrativeContact_telephone
  43. administrativeContact_telephoneExt

1 个答案:

答案 0 :(得分:2)

你需要的是cut,并且可以从gnuwin32,包coreutils获得它(例如)。

一旦你拥有它,

cut -d , -f 1,14-24,27-39,42-43 fileInput.csv > fileOutput.csv