在C#

时间:2016-11-01 02:56:13

标签: c# unicode text-files dynamically-generated

我需要创建一个文本文件(字母数字),其大小(精确或接近)以MB为单位等于我的输入数字,例如1 MB。我试着生成一个字符串,认为一个字符是16位或2字节,所以: 1KB = 1024字节= 1024 x 8位= 1024 x 8/16个字符= 512个字符。 但生成的文件似乎不是正确的:( 如果我生成字节数组并将其写入文件,则大小非常正确!

 public static void generateDummyFileBySize(long sizeInMb, string filePath) {

            byte[] data = new byte[sizeInMb * 1024 * 1024];
            Random rng = new Random();
            rng.NextBytes(data);
            File.WriteAllBytes(filePath, data);
        }

请帮帮我。这是我用来生成文本文件的代码

public static String generateStringSize(long sizeByte)
        {

            StringBuilder sb = new StringBuilder();
            Random rd = new Random();
            /**
             * Byte -> Bit -> Divide by 16 to num of char
             * */
            var numOfChars = sizeByte * 8 ;
            string allows = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
            int maxIndex = allows.Length - 1;
            for (int i = 0; i < numOfChars; i++)
            {
                int index = rd.Next(maxIndex);
                char c = allows[index];
                sb.Append(c);
            }
            return sb.ToString();
        }

public static void generateTextFileBySize(long size, string fileName)
        {
            long sizeOld = size;
            try
            {

                String s;
                String path = Directory.GetCurrentDirectory();
                var physicPath = path + Path.DirectorySeparatorChar + fileName;
                File.Delete(physicPath);
                if (size <= MAX_SIZE)
                {
                    s = StringUtil.generateStringSize(size);
                    Console.WriteLine("Generated a string with length " + size);
                    File.WriteAllText(physicPath, s, Encoding.UTF8);
                }
                else
                {
                    while (size > MAX_SIZE)
                    {
                        s = StringUtil.generateStringSize(MAX_SIZE);
                        Console.WriteLine("Appending " + MAX_SIZE + " to file");
                        File.AppendAllText(physicPath, s, Encoding.UTF8);
                        size -= MAX_SIZE;
                    }
                    s = StringUtil.generateStringSize(size);
                    File.AppendAllText(physicPath, s, Encoding.UTF8);
                }
                Console.WriteLine("Created file named " + fileName + " with size " + sizeOld + " bytes.");
            }
            catch (Exception ex)
            {
                Console.WriteLine("Error when generating file");
                Console.WriteLine(ex.Message);
            }
        }

2 个答案:

答案 0 :(得分:3)

问题在于:

var numOfChars = sizeByte * 8 ;

您创建了所需字符的八倍。而只是使用

var numOfChars = sizeByte;

当您存储为UTF-8时,您使用的每个字符占用一个字节,因此您不需要使用与您想要的字节数不同的字符数。

答案 1 :(得分:2)

对您的代码进行了以下更改:

8移除了var numOfChars = sizeByte*8;,因为在ASCII encoding中,每个character 1 byte也将编码更改为ASCII instead of UTF8以确保字符。

以下是工作代码,生成精确的1 MB文件,我已经测试了其他值,如8 MB,7 MB,结果是准确的

    String s = generateStringSize(1024 * 1024); 
    File.WriteAllText("D:\\Test1.txt", s, Encoding.ASCII);