JavaScript中是否有任何哈希码函数?

时间:2008-10-11 23:45:38

标签: javascript hash set hashcode

基本上,我正在尝试创建一个独特对象的对象,一组。我有一个很棒的想法,即只使用带有对象的JavaScript对象作为属性名称。如,

set[obj] = true;

这很有效。它适用于字符串和数字,但对于其他对象,它们似乎都“散列”到相同的值并访问相同的属性。是否有某种方法可以为对象生成唯一的哈希值?字符串和数字如何做,我可以覆盖相同的行为吗?

20 个答案:

答案 0 :(得分:52)

如果你想在JavaScript中使用像Java这样的hashCode()函数,那就是你的:

String.prototype.hashCode = function(){
    var hash = 0;
    for (var i = 0; i < this.length; i++) {
        var character = this.charCodeAt(i);
        hash = ((hash<<5)-hash)+character;
        hash = hash & hash; // Convert to 32bit integer
    }
    return hash;
}

这是Java(按位运算符)的实现方式。

答案 1 :(得分:32)

JavaScript对象只能使用字符串作为键(其他任何东西都转换为字符串)。

或者,您可以维护一个数组,该数组索引相关对象,并使用其索引字符串作为对象的引用。像这样:

var ObjectReference = [];
ObjectReference.push(obj);

set['ObjectReference.' + ObjectReference.indexOf(obj)] = true;

显然它有点冗长,但是你可以编写一些处理它的方法,然后设置所有方法。

编辑:

  

您的猜测是事实 - 这是JavaScript中定义的行为 - 特别是发生toString转换意味着您可以在将用作属性名称的对象上定义自己的toString函数。 - olliej

这引出了另一个有趣的观点;您可以在要散列的对象上定义toString方法,并且可以形成其哈希标识符。

答案 2 :(得分:31)

最简单的方法是为每个对象提供独特的toString方法:

(function() {
    var id = 0;

    /*global MyObject */
    MyObject = function() {
        this.objectId = '<#MyObject:' + (id++) + '>';
        this.toString= function() {
            return this.objectId;
        };
    };
})();

我遇到了同样的问题,这对我来说完全解决了这个问题,而且重新实现了一些脂肪Java风格Hashtable并添加了equals()hashCode()要容易得多到您的对象类。只要确保你不粘贴字符串'&lt; #MyObject:12&gt;进入你的哈希值,否则它将清除你带有该id的退出对象的条目。

现在我所有的哈希都非常寒冷。我几天前刚刚发布了一篇关于this exact topic的博客文章。

答案 3 :(得分:18)

我选择的解决方案类似于Daniel的解决方案,但是不是使用对象工厂并覆盖toString,而是在首次通过getHashCode函数请求时向表中显式添加哈希。有点凌乱,但更符合我的需求:))

Function.prototype.getHashCode = (function(id) {
    return function() {
        if (!this.hashCode) {
            this.hashCode = '<hash|#' + (id++) + '>';
        }
        return this.hashCode;
    }
}(0));

答案 4 :(得分:18)

你所描述的内容由Harmony WeakMaps涵盖,是ECMAScript 6规范(下一版JavaScript)的一部分。这是:一个集合,其中键可以是任何东西(包括未定义的)并且是不可枚举的。

这意味着除非您直接引用链接到它的键(任何对象!),否则无法获取对值的引用。对于与效率和垃圾收集相关的一系列引擎实现原因而言,它非常重要,但它也非常酷,因为它允许新的语义,如可撤销访问权限和传递数据而不暴露数据发送者。

来自MDN

var wm1 = new WeakMap(),
    wm2 = new WeakMap();
var o1 = {},
    o2 = function(){},
    o3 = window;

wm1.set(o1, 37);
wm1.set(o2, "azerty");
wm2.set(o1, o2); // A value can be anything, including an object or a function.
wm2.set(o3, undefined);
wm2.set(wm1, wm2); // Keys and values can be any objects. Even WeakMaps!

wm1.get(o2); // "azerty"
wm2.get(o2); // Undefined, because there is no value for o2 on wm2.
wm2.get(o3); // Undefined, because that is the set value.

wm1.has(o2); // True
wm2.has(o2); // False
wm2.has(o3); // True (even if the value itself is 'undefined').

wm1.has(o1);   // True
wm1.delete(o1);
wm1.has(o1);   // False

WeakMaps可用于当前的Firefox,Chrome和Edge。它们也在Node v7中支持,在v6中也支持--harmony-weak-maps标志。

答案 5 :(得分:13)

对于我的具体情况,我只关心对象和原始值的对象是否相等。对我有用的解决方案是将对象转换为其JSON表示并将其用作哈希。有一些限制,例如密钥定义的顺序可能不一致;但就像我说它对我有用,因为这些物体都是在一个地方生成的。

var hashtable = {};

var myObject = {a:0,b:1,c:2};

var hash = JSON.stringify(myObject);
// '{"a":0,"b":1,"c":2}'

hashtable[hash] = myObject;
// {
//   '{"a":0,"b":1,"c":2}': myObject
// }

答案 6 :(得分:8)

JavaScript规范将索引属性访问定义为对索引名称执行toString转换。例如,

myObject[myProperty] = ...;

相同
myObject[myProperty.toString()] = ...;

这在JavaScript中是必要的

myObject["someProperty"]

相同
myObject.someProperty

是的,这也让我感到难过: - (

答案 7 :(得分:8)

我前一段时间将a small JavaScript module放在一起为字符串,对象,数组等生成哈希码(我只是将其提交给GitHub :))

用法:

Hashcode.value("stackoverflow")
// -2559914341
Hashcode.value({ 'site' : "stackoverflow" })
// -3579752159

答案 8 :(得分:7)

在ECMAScript 6中,现在有一个Set可以按您的喜好运行:https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Set

最新的Chrome,FF和IE11已经提供。

答案 9 :(得分:4)

参考:https://developer.mozilla.org/en-US/docs/Web/JavaScript/Reference/Global_Objects/Symbol

您可以使用Es6符号创建唯一键和访问对象。     从Symbol()返回的每个符号值都是唯一的。符号值可以用作对象属性的标识符;这是数据类型的唯一目的。

var obj = {};

obj[Symbol('a')] = 'a';
obj[Symbol.for('b')] = 'b';
obj['c'] = 'c';
obj.d = 'd';

答案 10 :(得分:2)

基于标题,我们可以使用js生成强哈希,它可以用于根据对象,参数数组,字符串或其他任何东西生成唯一的哈希。

以后建立索引的方法避免了任何可能的匹配错误,同时允许从参数中检索索引(避免搜索/循环对象等):

async function H(m) {
  const msgUint8 = new TextEncoder().encode(m)                       
  const hashBuffer = await crypto.subtle.digest('SHA-256', msgUint8)          
  const hashArray = Array.from(new Uint8Array(hashBuffer))                    
  const hashHex = hashArray.map(b => b.toString(16).padStart(2, '0')).join('')
  console.log(hashHex)
}

/* Examples ----------------------- */
H("An obscure ....")
H(JSON.stringify( {"hello" : "world"} ))
H(JSON.stringify( [54,51,54,47] ))

在我的浏览器中,以上输出也应该与您相同(真的吗?):

bf1cf3fe6975fe382ab392ec1dd42009380614be03d489f23601c11413cfca2b
93a23971a914e5eacbf0a8d25154cda309c3c1c72fbb9914d47c60f3cb681588
d2f209e194045604a3b15bdfd7502898a0e848e4603c5a818bd01da69c00ad19

https://developer.mozilla.org/en-US/docs/Web/API/SubtleCrypto/digest#Converting_a_digest_to_a_hex_string

答案 11 :(得分:2)

这是我的简单解决方案,它返回一个唯一的整数。

var data = new Data(req.body);

答案 12 :(得分:1)

我的解决方案为全局Object对象引入了静态函数。

(function() {
    var lastStorageId = 0;

    this.Object.hash = function(object) {
        var hash = object.__id;

        if (!hash)
             hash = object.__id = lastStorageId++;

        return '#' + hash;
    };
}());

我认为这对JavaScript中的其他对象操作函数更方便。

答案 13 :(得分:0)

只需将隐藏的秘密属性与defineProperty enumerable: false

一起使用

very fast有效:

  • 首次读取的uniqueId: 1,257,500 ops / s
  • 所有其他: 309,226,485个操作
var nextObjectId = 1
function getNextObjectId() {
    return nextObjectId++
}

var UNIQUE_ID_PROPERTY_NAME = '458d576952bc489ab45e98ac7f296fd9'
function getObjectUniqueId(object) {
    if (object == null) {
        return null
    }

    var id = object[UNIQUE_ID_PROPERTY_NAME]

    if (id != null) {
        return id
    }

    if (Object.isFrozen(object)) {
        return null
    }

    var uniqueId = getNextObjectId()
    Object.defineProperty(object, UNIQUE_ID_PROPERTY_NAME, {
        enumerable: false,
        configurable: false,
        writable: false,
        value: uniqueId,
    })

    return uniqueId
}

答案 14 :(得分:0)

我结合了双眼失明和KimKha的答案。

以下是angularjs服务,它支持数字,字符串和对象。

exports.Hash = () => {
  let hashFunc;
  function stringHash(string, noType) {
    let hashString = string;
    if (!noType) {
      hashString = `string${string}`;
    }
    var hash = 0;
    for (var i = 0; i < hashString.length; i++) {
        var character = hashString.charCodeAt(i);
        hash = ((hash<<5)-hash)+character;
        hash = hash & hash; // Convert to 32bit integer
    }
    return hash;
  }

  function objectHash(obj, exclude) {
    if (exclude.indexOf(obj) > -1) {
      return undefined;
    }
    let hash = '';
    const keys = Object.keys(obj).sort();
    for (let index = 0; index < keys.length; index += 1) {
      const key = keys[index];
      const keyHash = hashFunc(key);
      const attrHash = hashFunc(obj[key], exclude);
      exclude.push(obj[key]);
      hash += stringHash(`object${keyHash}${attrHash}`, true);
    }
    return stringHash(hash, true);
  }

  function Hash(unkType, exclude) {
    let ex = exclude;
    if (ex === undefined) {
      ex = [];
    }
    if (!isNaN(unkType) && typeof unkType !== 'string') {
      return unkType;
    }
    switch (typeof unkType) {
      case 'object':
        return objectHash(unkType, ex);
      default:
        return stringHash(String(unkType));
    }
  }

  hashFunc = Hash;

  return Hash;
};

用法示例:

Hash('hello world'), Hash('hello world') == Hash('hello world')
Hash({hello: 'hello world'}), Hash({hello: 'hello world'}) == Hash({hello: 'hello world'})
Hash({hello: 'hello world', goodbye: 'adios amigos'}), Hash({hello: 'hello world', goodbye: 'adios amigos'}) == Hash({goodbye: 'adios amigos', hello: 'hello world'})
Hash(['hello world']), Hash(['hello world']) == Hash(['hello world'])
Hash(1), Hash(1) == Hash(1)
Hash('1'), Hash('1') == Hash('1')

输出

432700947 true
-411117486 true
1725787021 true
-1585332251 true
1 true
-1881759168 true

说明

如您所见,该服务的核心是KimKha创建的哈希函数。我在字符串中添加了类型,以便对象的构造也将影响最终的哈希值。对象碰撞。

双眼失明对象比较用于通过自我引用对象来防止无限递归。

用法

我创建了此服务,以便可以使用对象访问错误服务。这样一来,一项服务就可以向给定对象注册错误,而另一项服务可以确定是否发现了任何错误。

JsonValidation.js

ErrorSvc({id: 1, json: '{attr: "not-valid"}'}, 'Invalid Json Syntax - key not double quoted');

UserOfData.js

ErrorSvc({id: 1, json: '{attr: "not-valid"}'});

这将返回:

['Invalid Json Syntax - key not double quoted']

ErrorSvc({id: 1, json: '{"attr": "not-valid"}'});

这将返回

[]

答案 15 :(得分:0)

我将尝试比其他答案更深入。

即使JS具有更好的哈希支持,它也无法完美地对所有内容进行神奇的哈希处理,在许多情况下,您将必须定义自己的哈希函数。例如,Java具有良好的哈希支持,但是您仍然必须考虑并做一些工作。

一个问题是术语“哈希/哈希码”……存在加密哈希和非加密哈希。另一个问题是,您必须了解散列为何有用以及它如何工作。

大多数时候,当我们谈论JavaScript或Java中的哈希时,我们谈论的是非加密哈希,通常是关于hashmap / hashtable的哈希(除非我们正在处理身份验证或密码,这可以在服务器端进行)使用NodeJS ...)。

这取决于您拥有什么数据以及想要获得什么。

您的数据具有一些自然的“简单”唯一性:

  • 整数的哈希是...整数,因为它是唯一的,幸运的是您!
  • 字符串的哈希值...它取决于字符串,如果字符串表示唯一标识符,则可以将其视为哈希值(因此不需要哈希值)。
  • 任何间接地是唯一整数的东西都是最简单的情况
  • 这将遵守:如果对象相等,则哈希码相等

您的数据具有一些自然的“复合”唯一性:

  • 例如,对于人员对象,您可以使用名字,姓氏,生日等来计算哈希,...请参见Java的运作方式:Good Hash Function for Strings,或使用其他便宜且唯一的ID信息您的用例

您不知道您的数据将是什么:

  • 祝您好运...您可以序列化为字符串并以Java样式对其进行哈希处理,但是如果字符串较大且无法避免冲突(比如说整数(自身)的哈希),则可能会很昂贵。

对于未知数据,没有神奇有效的哈希技术,在某些情况下,这很容易,在其他情况下,您可能需要三思而后行。因此,即使JavaScript / ECMAScript添加了更多支持,也没有针对该问题的魔术语言解决方案。

实际上,您需要两件事:足够的唯一性,足够的速度

除此之外,它还很棒:“如果对象相等,则哈希码相等”

答案 16 :(得分:0)

如果要在查找对象中具有唯一值,可以执行以下操作:

创建查找对象

var lookup = {};

设置哈希码功能

function getHashCode(obj) {
    var hashCode = '';
    if (typeof obj !== 'object')
        return hashCode + obj;
    for (var prop in obj) // No hasOwnProperty needed
        hashCode += prop + getHashCode(obj[prop]); // Add key + value to the result string
    return hashCode;
}

<强>对象

var key = getHashCode({ 1: 3, 3: 7 });
// key = '1337'
lookup[key] = true;

<强>阵列

var key = getHashCode([1, 3, 3, 7]);
// key = '01132337'
lookup[key] = true;

其他类型

var key = getHashCode('StackOverflow');
// key = 'StackOverflow'
lookup[key] = true;

最终结果

{ 1337: true, 01132337: true, StackOverflow: true }

请注意,当对象或数组为空时,getHashCode不会返回任何值

getHashCode([{},{},{}]);
// '012'
getHashCode([[],[],[]]);
// '012'

这类似于@ijmacd解决方案getHashCode没有JSON依赖。

答案 17 :(得分:0)

如果你想使用对象作为键,你需要覆盖它们的toString方法,就像这里已经提到的那样。使用的哈希函数都很好,但它们只适用于相同的对象,而不适用于相同的对象。

我编写了一个从对象创建哈希的小型库,您可以轻松地将其用于此目的。对象甚至可以有不同的顺序,哈希将是相同的。在内部,您可以为哈希使用不同的类型(djb2,md5,sha1,sha256,sha512,ripemd160)。

以下是文档中的一个小例子:

var hash = require('es-hash');

// Save data in an object with an object as a key
Object.prototype.toString = function () {
    return '[object Object #'+hash(this)+']';
}

var foo = {};

foo[{bar: 'foo'}] = 'foo';

/*
 * Output:
 *  foo
 *  undefined
 */
console.log(foo[{bar: 'foo'}]);
console.log(foo[{}]);

该软件包可以在浏览器和Node-Js中使用。

存储库:https://bitbucket.org/tehrengruber/es-js-hash

答案 18 :(得分:0)

除了eyelidlessness的答案之外,这里还有一个为任何对象返回可重现的唯一ID的函数:

var uniqueIdList = [];
function getConstantUniqueIdFor(element) {
    // HACK, using a list results in O(n), but how do we hash e.g. a DOM node?
    if (uniqueIdList.indexOf(element) < 0) {
        uniqueIdList.push(element);
    }
    return uniqueIdList.indexOf(element);
}

正如你所看到的,它使用了一个非常低效的查找列表,但这是我现在能找到的最好的。

答案 19 :(得分:0)

如果你真的想要设置行为(我是通过Java知识),那么你将很难在JavaScript中找到解决方案。大多数开发人员会建议使用唯一键来表示每个对象,但这与set不同,因为您可以获得两个相同的对象,每个对象都有一个唯一的键。 Java API通过比较哈希代码值而不是键来检查重复值,并且由于JavaScript中没有对象的哈希码值表示,因此几乎不可能这样做。甚至Prototype JS库也承认了这个缺点,当它说:

  

“哈希可以被认为是一个   关联数组,绑定唯一键   价值观(不一定是   唯一的)...“

http://www.prototypejs.org/api/hash