如何将数字转换为自定义2char BaseX并返回? (又名:如何做Azure表属性压缩)

时间:2010-09-18 08:14:18

标签: c# math azure azure-storage azure-table-storage

类似于在十六进制中从0到F的计数方式,我有一个数字和字母数组,我想从...中“计算”...当我达到最大值时,我想重新开始“十”栏。

我需要这样来提高Azure Table中的存储效率,并保持我的PrimaryKeys很小(所以我可以在tinyURL中使用它们)。首先考虑只允许这些字符作为propertyName,如文档here所述。在下面的数组中,每个字符都根据Azure对其进行排序的方式进行定位。

  public static string[] AzureChars = new string[]
   {
        "0","1","2","3","4","5","6","7","8","9","A",
        "B","C","D","E","F","G","H","I",
        "J","K","L","M","N","O","P","Q",
        "R","S","T","U","V","W","X","Y",
        "Z","a","b","c","d","e","f","g",
        "h","i","j","k","l","m","n","o",
        "p","q","r","s","t","u","v","w",
        "x","y","z"       
   };

我的目标是使用2个字符串/ ASCII字符从字符串“00”到小写“zz”进行计数。

使用C#解决这个概念的最佳方法是什么? - 数组是否是正确的对象?
- 如何将给定字符(大写'Y')与它在数组中的位置相关联?

我只是试验这个想法。起初它似乎是一个很好的,但我没有看到有人考虑这样做。你觉得怎么样?

3 个答案:

答案 0 :(得分:3)

您的问题实际上是将数字转换为两位数的基数62。以下是将正数转换为任意基数的一般代码片段:

var n = 1234;
var baseNumber = 62;
var numberOfDigits = 2;
var digits = new Int32[numberOfDigits];
for (var i = 0; i < digits.Length; i += 1) {
  digits[i] = n%baseNumber;
  n /= baseNumber;
}

您必须将数字映射到字符,并使用查找表或小函数来执行此操作。

对于具有可变位数的附加功能的特定问题,我将编写此代码:

var n = 123456; 
var digitCount = 3;
var digits = "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
var number = String.Empty;
for (var i = 0; i < digitCount; ++i) {
  number = digits[n%digits.Length] + number;
  n /= digits.Length;
}

请注意,此代码会将0转换为0001转换为001等。但我认为这实际上就是您想要的。

要转换回来,您可以使用以下代码:

var n = 0;
for (var i = 0; i < number.Length; ++i)
  n = n*digits.Length + digits.IndexOf(number[i]);

String.IndexOf()不是最有效的转化方式,但在大多数情况下应该没问题。

请注意,如果您的原始号码大于可以存储在您的基本号码中的最大号码,则转换将导致不同的号码。对于基数62中的3位数,如果原始数字大于或等于zzz = 62^3 - 1 = 238327,则为真。

答案 1 :(得分:2)

使用模数(并获得余数)

        int i = AzureChars.Length;
        int index = 62 //character to lookup;
        string a = AzureChars[index % i];

获取char的索引:

        int index = Array.IndexOf(AzureChars, "Y");

像:

        string text = "YY";
        int index1 = Array.IndexOf(AzureChars, text[1].ToString());
        int index2 = Array.IndexOf(AzureChars, text[0].ToString());

也许您应该使用CharArray(char []),或者只使用长字符串:

 static string AzureChars= "012456789.....qrstuvwxyz";

一起说清楚:

    static void Main(string[] args)
    {
        char[] b = AzureCharConverter.ToCharArray(522);
        int i = AzureCharConverter.ToInteger(b);
    }


    public static class AzureCharConverter
    {
         private static readonly string _azureChars
         = "012456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";

         public static int ToInteger(string chars)
         {
                 int l = _azureChars.IndexOf(chars[0]);
                 int r = _azureChars.IndexOf(chars[1]);
                 return (l * _azureChars.Length) + r;
         }


         public static char[] ToCharArray(int value)
         {
                  char l = _azureChars[value / _azureChars.Length];
                  char r = _azureChars[value % _azureChars.Length];
                  return new char[] { l, r };
         }
    }

假设输入alpha总是两位数,结果总是小于3720

答案 2 :(得分:2)

由于数组的元素都是单个字符,因此您可以将其声明为字符数组:

public static char[] AzureChars = new char[]
{
    '0', '1', '2', '4', '5', '6', '7', '8', '9', 'A', 'B', 'C', 'D', 'E',
    'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S',
    'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g',
    'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u',
    'v', 'w', 'x', 'y', 'z'       
};

现在,您可以轻松编写一个函数,该函数返回所有 n 字符串的整个集合,用于任何所需的字符串长度 n 。我的版本是递归的;如果你发现它对于冗长的字符串来说太慢了,你可以优化它:

public static IEnumerable<string> AzureStrings(int desiredLength)
{
    if (desiredLength == 0)
        return new[] { "" };
    return AzureChars.SelectMany(ch => AzureStrings(desiredLength - 1)
                                       .Select(str => ch + str));
}

现在我们可以使用SkipTake生成序列的任何一部分:

// Prints “5v, 5w, 5x, 5y, 5z, 60, 61, 62, 64, 65”
Console.WriteLine(string.Join(", ", AzureStrings(2).Skip(300).Take(10)));
// Prints “3721”
Console.WriteLine(AzureStrings(2).Count());

尽管在输出任何内容之前计算出前300个元素,但它对我来说足够快。即使这种疯狂的计算也需要不到一秒的时间:

// Prints “5PkS, 5PkT, 5PkU, 5PkV, 5PkW, 5PkX, 5PkY, 5PkZ, 5Pka, 5Pkb”
Console.WriteLine(string.Join(", ", AzureStrings(4).Skip(1000000).Take(10)));