我正在使用哈希表从文件读取数据并制作群集。
说文件中的数据是:
umair,i,umair
sajid,mark,i , k , i
输出如下:
[{umair,umair},i]
[sajid,mark,i,i,k]
但我的代码不起作用。这是代码:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using System.Collections;
namespace readstringfromfile
{
class Program
{
static void Main()
{
/* int i = 0;
foreach (string line in File.ReadAllLines("newfile.txt"))
{
string[] parts = line.Split(',');
foreach (string part in parts)
{
Console.WriteLine("{0}:{1}", i,part);
}
i++; // For demo only
}*/
Hashtable hashtable = new Hashtable();
using (StreamReader r = new StreamReader("newfile.txt"))
{
string line;
while ((line = r.ReadLine()) != null)
{
string[] records = line.Split(',');
foreach (string record in records)
{
if (hashtable[records] == null)
hashtable[records] = (int)0;
hashtable[records] = (int)hashtable[records] + 1;
Console.WriteLine(hashtable.Keys);
}
/////this portion is not working/////////////////////////////////////
foreach (DictionaryEntry entry in hashtable)
{
for (int i = 0; i < (int)hashtable[records]; i++)
{
Console.WriteLine(entry);
}
}
}
}
}
}
}
答案 0 :(得分:2)
在插入哈希表时(以及从中读取时),您正在使用records
数组,而不是使用foreach-variable record
。此外,在最后看,您基于records
而不是当前entry.Key
进行迭代。您还在范围太宽的情况下声明哈希表,导致所有行都插入到相同的哈希表中,而不是每行一个。
public static void Main() {
var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
foreach (var line in lines) {
var hashtable = new Hashtable();
var records = line.Split(',');
foreach (var record in records) {
if (hashtable[record] == null)
hashtable[record] = 0;
hashtable[record] = (Int32)hashtable[record] + 1;
}
var str = "";
foreach (DictionaryEntry entry in hashtable) {
var count = (Int32)hashtable[entry.Key];
for (var i = 0; i < count; i++) {
str += entry.Key;
if (i < count - 1)
str += ",";
}
str += ",";
}
// Remove last comma.
str = str.TrimEnd(',');
Console.WriteLine(str);
}
Console.ReadLine();
}
但是,您应该考虑使用通用Dictionary<TKey,TValue>类,并在构建大量字符串时使用StringBuilder。
public static void Main() {
var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
foreach (var line in lines) {
var dictionary = new Dictionary<String, Int32>();
var records = line.Split(',');
foreach (var record in records) {
if (!dictionary.ContainsKey(record))
dictionary.Add(record, 1);
else
dictionary[record]++;
}
var str = "";
foreach (var entry in dictionary) {
for (var i = 0; i < entry.Value; i++) {
str += entry.Key;
if (i < entry.Value - 1)
str += ",";
}
str += ",";
}
// Remove last comma.
str = str.TrimEnd(',');
Console.WriteLine(str);
}
Console.ReadLine();
}
答案 1 :(得分:0)
您正在尝试对序列的元素进行分组。 LINQ有一个内置的运算符;它用作group ... by ... into ...
或等效方法.GroupBy(...)
这意味着您可以将代码(不包括文件I / O等)编写为:
var lines = new[] { "umair,i,umair", "sajid,mark,i,k,i" };
foreach (var line in lines) {
var groupedRecords =
from record in line.Split(',')
group record by record into recordgroup
from record in recordgroup
select record;
Console.WriteLine(
string.Join(
",", groupedRecords
)
);
}
如果您更喜欢更短的代码,则循环等效地写为:
foreach (var line in lines)
Console.WriteLine(string.Join(",",
line.Split(',').GroupBy(rec=>rec).SelectMany(grp=>grp)));
两个版本都会输出......
umair,umair,i
sajid,mark,i,i,k
请注意,您确实不应该使用Hashtable
- 这只是Dictionary
的类型不安全的慢版本,几乎用于所有目的。此外,您提到的输出示例包括[]
和{}
个字符 - 但您没有指定它们应该如何或是否应该被包含在内,所以我将它们排除在外。
LINQ组只不过是一个带有Key的元素序列(这里是相同的字符串)(这里是一个字符串)。因此,调用GroupBy
会将记录序列转换为一系列组。但是,您只想简单地连接这些组。 SelectMany
是这样一种连接:从一系列项目中,它将每个项目的“内容”连接成一个大的序列。