我的哈希表不起作用

时间:2011-01-28 06:23:43

标签: c# .net hashtable

我正在使用哈希表从文件读取数据并制作群集。

说文件中的数据是:

umair,i,umair
sajid,mark,i , k , i

输出如下:

[{umair,umair},i]
[sajid,mark,i,i,k]

但我的代码不起作用。这是代码:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Collections;
namespace readstringfromfile
{

    class Program
    {
        static void Main()
        {
            /* int i = 0;
             foreach (string line in File.ReadAllLines("newfile.txt"))
             {
                 string[] parts = line.Split(',');
                 foreach (string part in parts)
                 {
                     Console.WriteLine("{0}:{1}", i,part);
                 }
                 i++; // For demo only
             }*/
            Hashtable hashtable = new Hashtable();

            using (StreamReader r = new StreamReader("newfile.txt"))
            {
                string line;
                while ((line = r.ReadLine()) != null)
                {
                    string[] records = line.Split(',');
                    foreach (string record in records)
                    {
                        if (hashtable[records] == null)
                            hashtable[records] = (int)0;

                        hashtable[records] = (int)hashtable[records] + 1;
                        Console.WriteLine(hashtable.Keys);

                    }
/////this portion is not working/////////////////////////////////////

                    foreach (DictionaryEntry entry in hashtable)
                    {
                        for (int i = 0; i < (int)hashtable[records]; i++)
                        {
                            Console.WriteLine(entry);
                        }
                    }
                }
            }
        }
    }
}

2 个答案:

答案 0 :(得分:2)

在插入哈希表时(以及从中读取时),您正在使用records数组,而不是使用foreach-variable record。此外,在最后看,您基于records而不是当前entry.Key进行迭代。您还在范围太宽的情况下声明哈希表,导致所有行都插入到相同的哈希表中,而不是每行一个。

public static void Main() {
    var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
    foreach (var line in lines) {
        var hashtable = new Hashtable();
        var records = line.Split(',');

        foreach (var record in records) {
            if (hashtable[record] == null)
                hashtable[record] = 0;

            hashtable[record] = (Int32)hashtable[record] + 1;
        }

        var str = "";
        foreach (DictionaryEntry entry in hashtable) {
            var count = (Int32)hashtable[entry.Key];
            for (var i = 0; i < count; i++) {
                str += entry.Key;
                if (i < count - 1)
                    str += ",";
            }
            str += ",";
        }

        // Remove last comma.
        str = str.TrimEnd(',');

        Console.WriteLine(str);
    }

    Console.ReadLine();
}

但是,您应该考虑使用通用Dictionary<TKey,TValue>类,并在构建大量字符串时使用StringBuilder

public static void Main() {
    var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
    foreach (var line in lines) {
        var dictionary = new Dictionary<String, Int32>();
        var records = line.Split(',');

        foreach (var record in records) {
            if (!dictionary.ContainsKey(record))
                dictionary.Add(record, 1);
            else
                dictionary[record]++;
        }

        var str = "";
        foreach (var entry in dictionary) {
            for (var i = 0; i < entry.Value; i++) {
                str += entry.Key;
                if (i < entry.Value - 1)
                    str += ",";
            }
            str += ",";
        }

        // Remove last comma.
        str = str.TrimEnd(',');

        Console.WriteLine(str);
    }

    Console.ReadLine();
}

答案 1 :(得分:0)

您正在尝试对序列的元素进行分组。 LINQ有一个内置的运算符;它用作group ... by ... into ...或等效方法.GroupBy(...)

这意味着您可以将代码(不包括文件I / O等)编写为:

var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
foreach (var line in lines) {
    var groupedRecords =
        from record in line.Split(',')
        group record by record into recordgroup
        from record in recordgroup
        select record;

    Console.WriteLine(
        string.Join(
            ",", groupedRecords
        )
    );
}

如果您更喜欢更短的代码,则循环等效地写为:

foreach (var line in lines) 
    Console.WriteLine(string.Join(",",
        line.Split(',').GroupBy(rec=>rec).SelectMany(grp=>grp)));

两个版本都会输出......

umair,umair,i
sajid,mark,i,i,k

请注意,您确实不应该使用Hashtable - 这只是Dictionary的类型不安全的慢版本,几乎用于所有目的。此外,您提到的输出示例包括[]{}个字符 - 但您没有指定它们应该如何或是否应该被包含在内,所以我将它们排除在外。

LINQ组只不过是一个带有Key的元素序列(这里是相同的字符串)(这里是一个字符串)。因此,调用GroupBy会将记录序列转换为一系列组。但是,您只想简单地连接这些组。 SelectMany是这样一种连接:从一系列项目中,它将每个项目的“内容”连接成一个大的序列。