高级.Csv解析 - 调查答案文件?

时间:2011-06-29 17:40:49

标签: c# parsing statistics text-formatting file-read

首先,我想指出我已经知道使用逗号或制表符空格等解析.csv文件。但是我仍然有问题而且我有点卡住了。

我要做的是构建一个读取.csv调查答案文件的应用程序(最好是所有扩展类型,但让我们从一个开始)。这些调查答案文件是由其他网站预先生成的。 (即用户从调查网站下载他们的调查答案,然后使用我的应用程序)。该应用程序的目的是对数据进行统计分析。

所以我遇到的问题是如何从不相关的文本中找出如何阅读和分离问题的答案。对于具有不同问题类型等的多个答案文件,我需要一种可重用的方法来执行此操作。

我知道更简单的方法是让用户使用我的应用程序创建调查,然后对其进行分析,这样我就可以控制格式,但目前这不是一个选项。

注意:我计划读取系统中的所有变量,然后允许用户从列表中选择变量并对其执行分析算法。

我再次知道他们是高级的csv读者,我只是在寻找有关如何解决问题的想法。

3 个答案:

答案 0 :(得分:1)

使用 Microsoft.VisualBasic.FileIO.TextFieldParser

它专门用于解析.csv文件。它也处理字段中的逗号。

答案 1 :(得分:0)

对于解析CSV,您可以使用我在此post的解决方案中描述的正则表达式。这将逐行评估。

答案 2 :(得分:0)

文件的第一行(CSV(分隔符是逗号)还是TSV(分隔符是制表符))是否包含“列”名称? 是否所有行都具有相同数量的值(如果需要,连续分隔符指定缺失值或空值)?

如果两个问题的答案都是肯定的,一个选项是使用ADO和JET 4.0驱动程序将每个文件作为关系数据源读取。

有大量样本证明了这项技术。开始here.