有没有办法在Java中生成与C#中生成的UUID相同的UUID?

时间:2017-07-26 21:20:23

标签: java c# scala hash guid

我将C#脚本移植到Spark(Scala)中,我遇到了Scala中UUID生成与C#中GUID生成的问题。

有没有办法在Java中生成与C#中生成的UUID相同的UUID?

我通过从字符串的MD5哈希创建Guid来为数据库生成主键。 最后,我想在Java / Scala中生成与C#脚本中的UUID相匹配的UUID,因此使用C#实现进行散列的数据库中的现有数据不需要重新散列。

C#到端口:

String ex = "Hello World";
Console.WriteLine("String to Hash: {0}", ex);
byte[] md5 = GetMD5Hash(ex);
Console.WriteLine("Hash: {0}", BitConverter.ToString(md5));
Guid guid = new Guid(md5);
Console.WriteLine("Guid: {0}", guid);

private static byte[] GetMD5Hash(params object[] values) {
  using (MD5 md5 = MD5.Create())
    return md5.ComputeHash(Encoding.UTF8.GetBytes(s));
} 

Scala移植代码:

val to_encode = "Hello World"
val md5hash = MessageDigest.getInstance("MD5")
 .digest(to_encode.trim().getBytes())
val md5string = md5hash.map("%02x-".format(_)).mkString
val uuid_bytes = UUID.nameUUIDFromBytes(to_encode.trim().getBytes())
printf("String to encode: %s\n", to_encode)
printf("MD5: %s\n", md5string)
printf("UUID: %s\n", uuid_bytes.toString)

来自C#的结果

  • 要散列的字符串:Hello World
  • MD5:B1-0A-8D-B1-64-E0-75-41-05-B7-A9-9B-E7-2E-3F-E5
  • 指导:b18d0ab1-e064-41 75 - 05 b7-a99be72e3fe5

Scala的结果

  • 要散列的字符串:Hello World
  • MD5:b10a8db164e0754105b7a99be72e3fe5
  • UUID:b10a8db1-64e0- 35 41- 85 b7-a99be72e3fe5

什么有效:

  • MD5哈希(GUID和UUID所基于的)匹配

什么不是:

  • 前三个字段的字节序在C#中切换(橙色)
    • C#的GUID选择前三个字段(4,2,2)的本地字节顺序,在这种情况下,最后一个字段(8)为小端和Big Endian,而Java为#s UUID对所有四个字段使用Big Endian排序;这解释了C#中前三个字段的字节顺序。
  • 第四个和第五个字节不同(红色)
    • Java为了表示UUID的版本和变体而切换6-7位,这可以解释字节4和5的差异。这似乎是障碍。
  • 我知道Java使用有符号字节,而C#有无符号字节;这也可能是相关的。

没有操纵字节,还有其他方法可以解决这个问题吗?

1 个答案:

答案 0 :(得分:5)

TL; DR

如果您希望C#和Java的行为方式完全相同(并且您对现有的C#行为感到满意),则需要手动重新排序uuid_bytes中的部分字节。 (即交换您识别为无序的一些条目。)

此外,您不应该使用:

UUID.nameUUIDFromBytes(to_encode.trim().getBytes())

但改为使用:

public static String getGuidFromByteArray(byte[] bytes) {
    ByteBuffer bb = ByteBuffer.wrap(bytes);
    long high = bb.getLong();
    long low = bb.getLong();
    UUID uuid = new UUID(high, low);
    return uuid.toString();
}

https://stackoverflow.com/a/24409153/34092无耻地偷走了:)

附加背景

如果你不清楚,在处理C#' GUIDs时:

  

请注意,返回的字节数组中的字节顺序是不同的   来自Guid值的字符串表示。的顺序   开始的四字节组和接下来的两个双字节组是   反转,而最后两个字节组的顺序和结束   六字节组是一样的。该示例提供了一个说明。

And

  

ToString方法返回的十六进制字符串的顺序   取决于计算机体系结构是否为little-endian或   大端。

在您的C#中,而不是使用:

Console.WriteLine("Guid: {0}", guid);

您可能需要考虑使用:

Console.WriteLine(BitConverter.ToString(guid.ToByteArray()));

您现有的代码在幕后调用ToString。唉,ToStringToByteArray不会返回same order中的字节。