我正在运行Windows 7并安装了MS Office。每次下载.csv文件时,“另存为...”对话框中的“文件类型”行默认为“Microsoft Office Excel逗号分隔值文件”。 实际上是否存在与“普通”.csv?
不同的Microsoft特定格式Google搜索相关字词会返回各种令人难以置信的无法提供信息的页面,例如this one。是否使用此格式丢失或获取任何信息或任何编码方式,而不仅仅是将文件视为.csv,符合general standards?
答案 0 :(得分:5)
是的,几乎肯定存在差异。 从我的头脑:英语Excel使用“,”作为分隔符。德语语言环境使用“;”作为分隔符,如果要使用逗号分隔符导入csv,则需要执行其他导入步骤。这不是德国语言环境所独有的,大约1/4到1/3的世界使用“;”。
此外,对于复杂字符串的转义(和;和文本中)可能存在差异,这些字符串可能与程序编程不同。 这不是错误,因为csv“格式”并没有真正标准化,并且有无数的程序正在滚动自己的csv解析器,这会导致各种各样的问题,因为他们忘了处理极端情况。
我曾经读过有关csv是数据交换格式瘟疫的评论,因为它很难做到正确。我不能同意,我必须每天处理它们,并且他们非常讨厌与之合作。 开源粉丝会因此而讨厌我,但我认为csv是数据交换的不良选择,即使xlsx更好,因为它有明确的规则。
答案 1 :(得分:4)
有两件事正在发生。缩写(和后缀)“CSV”可以表示字符分隔值,也可以表示逗号分隔值。 “Microsoft Office Excel逗号分隔值文件”是一种消歧,意味着您在记录中有多个值,字段值以逗号分隔。
以逗号分隔的值文件中的值本身可能包含逗号(如果它们被正确地stropped(引用))。通常情况下,stropping会在一些或所有领域附近引用双引号。
MS Excel还支持字段中间的换行符,再次正确地调整。