将文本文件解析为字典

时间:2012-11-20 17:22:30

标签: c# file parsing text dictionary

我有一个包含数百个配置值的文本文件。配置数据的一般格式是“Label:Value”。使用C#.net,我想阅读这些配置,并在代码的其他部分使用值。我的第一个想法是,我会使用字符串搜索来查找标签,然后解析标签后面的值并将它们添加到字典中,但考虑到我必须搜索的标签/值的数量,这似乎相当繁琐。我有兴趣听听有关可能的架构来执行此任务的一些想法。我已经包含了一小部分示例文本文件,其中包含一些标签和值(如下所示)。几个注意事项:值并不总是数字(如AUX序列号中所示);无论出于何种原因,文本文件使用空格(\ s)而不是制表符(\ t)进行格式化。提前感谢你花时间思考这个问题。

示例文字:

 AUX Serial Number:  445P000023       AUX Hardware Rev:           1

 Barometric Pressure Slope:     -1.452153E-02
 Barometric Pressure Intercept: 9.524336E+02

6 个答案:

答案 0 :(得分:5)

这是一个不错的小脑痒。我认为这段代码可能会指出你正确的方向。请注意,这会填充Dictionary<string, string>,因此不会将值转换为整数等。另外,请原谅一塌糊涂(以及糟糕的命名惯例)。根据我的思路,这是一个快速的写作。

Dictionary<string, string> allTheThings = new Dictionary<string, string>();

public void ReadIt()
{
    // Open the file into a streamreader
    using (System.IO.StreamReader sr = new System.IO.StreamReader("text_path_here.txt"))
    {
        while (!sr.EndOfStream) // Keep reading until we get to the end
        {
            string splitMe = sr.ReadLine();
            string[] bananaSplits = splitMe.Split(new char[] { ':' }); //Split at the colons

            if (bananaSplits.Length < 2) // If we get less than 2 results, discard them
                continue; 
            else if (bananaSplits.Length == 2) // Easy part. If there are 2 results, add them to the dictionary
                allTheThings.Add(bananaSplits[0].Trim(), bananaSplits[1].Trim());
            else if (bananaSplits.Length > 2)
                SplitItGood(splitMe, allTheThings); // Hard part. If there are more than 2 results, use the method below.
        }
    }
}

public void SplitItGood(string stringInput, Dictionary<string, string> dictInput)
{
    StringBuilder sb = new StringBuilder();
    List<string> fish = new List<string>(); // This list will hold the keys and values as we find them
    bool hasFirstValue = false;

    foreach (char c in stringInput) // Iterate through each character in the input
    {
        if (c != ':') // Keep building the string until we reach a colon
            sb.Append(c);
        else if (c == ':' && !hasFirstValue)
        {
            fish.Add(sb.ToString().Trim());
            sb.Clear();
            hasFirstValue = true;
        }
        else if (c == ':' && hasFirstValue)
        {

            // Below, the StringBuilder currently has something like this:
            // "    235235         Some Text Here"
            // We trim the leading whitespace, then split at the first sign of a double space
            string[] bananaSplit = sb.ToString()
                                     .Trim()
                                     .Split(new string[] { "  " },
                                            StringSplitOptions.RemoveEmptyEntries);

            // Add both results to the list
            fish.Add(bananaSplit[0].Trim());
            fish.Add(bananaSplit[1].Trim());
            sb.Clear();
        }                    
    }

    fish.Add(sb.ToString().Trim()); // Add the last result to the list

    for (int i = 0; i < fish.Count; i += 2)
    {
        // This for loop assumes that the amount of keys and values added together
        // is an even number. If it comes out odd, then one of the lines on the input
        // text file wasn't parsed correctly or wasn't generated correctly.
        dictInput.Add(fish[i], fish[i + 1]); 
    }
}

答案 1 :(得分:0)

因此,考虑到您所限制的格式,我能想到的唯一一般方法是首先找到该行的第一个冒号并将其前面的所有内容作为标签。跳过所有空格字符,直到找到第一个非空白字符。将所有非空白字符作为标签的值。如果在该值结束后有一个冒号,则将前一个值结束后的所有内容作为下一个值添加到冒号并重复。您可能还需要修剪标签周围的空白区域。

你可能能够用正则表达式来捕捉这个含义,但是如果可以的话,它可能不会很漂亮;除非你的整个开发团队非常精通他们,否则我会避免这种复杂的事情。

答案 2 :(得分:0)

我会尝试这样的事情:

  1. 虽然字符串包含三倍空格,但请用双倍空格替换它。
  2. 将所有“:”和“:”(:带双倍空格)替换为“:”。
  3. 将所有“”(双倍空格)替换为'\ n'(新行)。
  4. 如果行不包含':'而不是跳过该行。否则,使用string.Split(':')。这样您就会收到2个字符串(键和值)的数组。其中一些可能在开头或结尾包含空字符。
  5. 使用string.Trim()删除那些空字符。
  6. 将收到的密钥和值添加到词典。
  7. 我不确定它是否能解决你的所有情况,但这是一个一般的线索,我将如何尝试这样做。 如果它工作,你可以考虑性能(在任何可能的地方使用StringBuilder而不是字符串等。)。

答案 3 :(得分:0)

这可能是我写过的最脏的功能,但它确实有效。

            StreamReader reader = new StreamReader("c:/yourFile.txt");

            Dictionary<string, string> yourDic = new Dictionary<string, string>();            

            StreamReader reader = new StreamReader("c:/yourFile.txt");

            Dictionary<string, string> yourDic = new Dictionary<string, string>();

            while (reader.Peek() >= 0)
            {
                string line = reader.ReadLine();
                string[] data = line.Split(':');

                if (line != String.Empty)
                {
                    for (int i = 0; i < data.Length - 1; i++)
                    {
                        if (i != 0)
                        {
                            bool isPair;
                            if (i % 2 == 0)
                            {
                                isPair = true;
                            }
                            else
                            {
                                isPair = false;
                            }

                            if (isPair)
                            {
                                string keyOdd = data[i].Trim();
                                try { keyOdd = keyOdd.Substring(keyOdd.IndexOf(' ')).TrimStart(); }
                                catch { }
                                string valueOdd = data[i + 1].TrimStart();
                                try { valueOdd = valueOdd.Remove(valueOdd.IndexOf(' ')); } catch{}
                                yourDic.Add(keyOdd, valueOdd);
                            }
                            else
                            {
                                string keyPair = data[i].TrimStart();
                                keyPair = keyPair.Substring(keyPair.IndexOf(' ')).Trim();
                                string valuePair = data[i + 1].TrimStart();
                                try { valuePair = valuePair.Remove(valuePair.IndexOf(' ')); } catch { }
                                yourDic.Add(keyPair, valuePair);
                            }

                        }
                        else
                        {
                            string key = data[i].Trim();
                            string value = data[i + 1].TrimStart();
                            try { value = value.Remove(value.IndexOf(' ')); } catch{}
                            yourDic.Add(key, value);
                        }
                    }
                }
            }

它是如何工作的?很好地分割你可以知道你可以在数组的每个位置得到什么的线,所以我只使用偶数和奇数值。 调试此功能时,您将理解我:D。它填补了你需要的词典。

答案 4 :(得分:0)

我有另一个想法。值是否包含空格?如果没有,你可以这样做:

  1. 忽略空格,直到您读取其他一些字符(键的第一个字符)。
  2. 读取字符串直到':'发生。
  3. 修剪你得到的钥匙。
  4. 忽略空格,直到您读取其他一些字符(第一个值为char)。
  5. 阅读,直到你得到空炭。
  6. 修剪你得到的值。
  7. 如果是结束而不是停止。否则,请返回第1步。
  8. 祝你好运。

答案 5 :(得分:-1)

也许这样的事情会起作用,小心':'字符

            StreamReader reader = new StreamReader("c:/yourFile.txt");

            Dictionary<string, string> yourDic = new Dictionary<string, string>();

            while (reader.Peek() >= 0)
            {
                 string line = reader.ReadLine();
                 yourDic.Add(line.Split(':')[0], line.Split(':')[1]);
            }

无论如何,我建议以某种方式组织该文件,以便始终知道它的格式。