如何在C#中的文本文件中读取双引号(“)?

时间:2011-12-04 12:36:00

标签: c# parsing

我必须阅读一个文本文件,然后使用VS 2010在C#中解析它。示例文本如下,

[TOOL_TYPE]

; provides the name of the selected tool for programming

“Phoenix Select Advanced”;

[TOOL_SERIAL_NUMBER]

; provides the serial number for the tool

7654321;

[PRESSURE_CORRECTION]

; provides the Pressure correction information requirement

 “Yes”;

[SURFACE_MOUNT]

; provides the surface mount information

“Yes”;

[SAPPHIRE_TYPE]

; provides the sapphire type information

“No”;

现在我只需解析字符串数据(双引号)和标题(方括号[]),然后将其保存到另一个文本文件中。我可以成功解析标题,但双引号中的字符串数据显示不正确,如下所示。

[TOOL_TYPE]
�Phoenix Select Advanced�;
[TOOL_SERIAL_NUMBER]
7654321;
[PRESSURE_CORRECTION]
�Yes�;
[SURFACE_MOUNT]
�Yes�;
[SAPPHIRE_TYPE]
�No�;
[EXTENDED_TELEMETRY]
�Yes�;
[OVERRIDE_SENSE_RESISTOR]
�No�;

请注意每当出现双引号时出现的特殊字符( )。

如何在目标文件中编写双引号(“)并避免( )?

更新

我使用以下行进行解析

temporaryconfigFileWriter.WriteLine(configFileLine,false,Encoding.Unicode);

以下是我正在使用的完整代码:

        string temporaryConfigurationFileName = System.Environment.GetFolderPath(Environment.SpecialFolder.Desktop) + "\\Temporary_Configuration_File.txt";

        //Pointers to read from Configuration File 'configFileReader' and to write to Temporary Configuration File 'temporaryconfigFileWriter'
        StreamReader configFileReader = new StreamReader(CommandLineVariables.ConfigurationFileName);
        StreamWriter temporaryconfigFileWriter = new StreamWriter(temporaryConfigurationFileName);

        //Check whether the 'END_OF_FILE' header is specified or not, to avoid searching for end of file indefinitely
        if ((File.ReadAllText(CommandLineVariables.ConfigurationFileName)).Contains("[END_OF_FILE]"))
        {
            //Read the file untill reaches the 'END_OF_FILE'
            while (!((configFileLine = configFileReader.ReadLine()).Contains("[END_OF_FILE]")))
            {
                configFileLine = configFileLine.Trim();
                if (!(configFileLine.StartsWith(";")) && !(string.IsNullOrEmpty(configFileLine)))
                {
                    temporaryconfigFileWriter.WriteLine(configFileLine, false, Encoding.UTF8);
                }
            }
            // to write the last header [END_OF_FILE]
            temporaryconfigFileWriter.WriteLine(configFileLine);

            configFileReader.Close();
            temporaryconfigFileWriter.Close();
        }

2 个答案:

答案 0 :(得分:5)

您的输入文件不包含双引号,这是谎言。它包含opening double quoteclosing double quote而不是标准版本。

首先,您必须确保使用正确的编码读取输入(尝试多个输入,只需在C#的文本框中显示字符串,如果它能够非常快速地显示字符,您将看到它)

如果你想在你的输出中出现这样的字符,你必须把输出文件写成除ASCII以外的东西,如果你把它写成UTF-8,你应该确保它以字节顺序标记开头(否则它会可读,但像记事本这样的软件会显示2个字符,因为它不会检测到文件不是ASCII)。

另一种选择是简单地将替换为"

答案 1 :(得分:3)

您似乎使用了正确的印刷引号(“...”)而不是直接的ASCII引号("...")。我的猜测是你用错误的编码读取文本文件。

如果您可以在记事本中正确地看到它们,并且ASCII或其中一种Unicode编码都不起作用,那么它可能是代码页1252.您可以通过

获取该编码
Encoding.GetEncoding(1252)