标签: input data-mining similarity
我正在尝试实施一个近似的memoization系统。
这种系统在输入数据和昂贵计算产生的结果之间建立关联。这样,如果再次收到相同的或类似的输入,我们不需要再次执行相同的计算。
在这样的系统中,接收的输入数据经常采用相似的值是很重要的。如果没有发生这种情况,那么这意味着系统接收的大部分时间都是非常不同的而不是相似的值,因此系统中不存在任何关联。因此,在这种情况下,这个系统是没用的。
你能不能给我一些这样的数据的例子,所以数据不稀疏,或者它们可以很容易地聚类,或者它们是通过相似函数相关的?