最近,我遇到了V8用于优化js代码的隐藏类和内联缓存的概念。很好。
我了解对象在内部表示为隐藏类。两个对象可能具有相同的属性,但隐藏的类不同(取决于属性分配的顺序)。
V8还使用内联缓存概念直接检查偏移量以访问对象的属性,而不是使用对象的隐藏类来确定偏移量。
代码-
function Point(x, y) {
this.x = x;
this.y = y;
}
function processPoint(point) {
// console.log(point.x, point.y, point.a, point.b);
// let x = point;
}
function main() {
let p1 = new Point(1, 1);
let p2 = new Point(1, 1);
let p3 = new Point(1, 1);
const N = 300000000;
p1.a = 1;
p1.b = 1;
p2.b = 1;
p2.a = 1;
p3.a = 1;
p3.b = 1;
let start_1 = new Date();
for(let i = 0; i< N; i++ ) {
if (i%4 != 0) {
processPoint(p1);
} else {
processPoint(p2)
}
}
let end_1 = new Date();
let t1 = (end_1 - start_1);
let start_2 = new Date();
for(let i = 0; i< N; i++ ) {
if (i%4 != 0) {
processPoint(p1);
} else {
processPoint(p1)
}
}
let end_2 = new Date();
let t2 = (end_2 - start_2);
let start_3 = new Date();
for(let i = 0; i< N; i++ ) {
if (i%4 != 0) {
processPoint(p1);
} else {
processPoint(p3)
}
}
let end_3 = new Date();
let t3 = (end_3 - start_3);
console.log(t1, t2, t3);
}
(function(){
main();
})();
我期望结果像 t1>(t2 = t3),因为:
第一个循环:V8运行两次后将尝试进行优化,但很快会遇到不同的隐藏类,因此会失去优化。
第二个循环:始终调用同一对象,因此可以使用内联缓存。
第三循环:与第二循环相同,因为隐藏的类相同。
但是结果并不令人满意。我得到了(并且类似的结果一次又一次地运行)-
3553 4805 4556
问题:
为什么结果不如预期?我的假设哪里出了错?
如何更改此代码以演示隐藏的类并提高内联缓存性能?
我从一开始就弄错了吗?
是否存在仅通过让对象共享对象来提高内存效率的隐藏类?
是否还有其他一些网站提供了一些简单的性能改进示例?
我正在使用节点8.9.4进行测试。预先感谢。
来源:
https://draft.li/blog/2016/12/22/javascript-engines-hidden-classes/
https://richardartoul.github.io/jekyll/update/2015/04/26/hidden-classes.html
还有更多..
答案 0 :(得分:1)
V8开发人员在这里。摘要为:微基准测试很难,不要这样做。
首先,在您的代码已发布的情况下,我看到380 380 380
是预期的输出,因为function processPoint
为空,所以所有循环都执行相同的工作(即,没有工作) ),无论您选择哪个点对象。
很难测量单态和2路多态内联高速缓存之间的性能差异,因为它并不大,因此您必须非常注意基准测试在做什么。例如,console.log
太慢了,以至于会掩盖其他所有内容。
您还必须注意内联的影响。当您的基准测试有许多迭代时,代码将得到优化(在运行waaaay两次以上之后),并且优化的编译器将(在某种程度上)内联函数,从而可以进行后续的优化(特别是:消除各种事情),从而可以显着地优化代码。更改您要测量的内容。编写有意义的微基准测试很困难;您将无法检查生成的程序集和/或不了解您正在研究的JavaScript引擎的实现细节。
要记住的另一件事是内联缓存在哪里,以及随着时间的推移它们将处于什么状态。不管内联如何,processPoint
之类的函数都不知道或不在乎从何处调用它。一旦其内联缓存是多态的,即使在基准测试的稍后阶段(在这种情况下,在第二和第三循环中)类型也会稳定,它们将保持多态。
试图隔离效果时要记住的另一件事是,长时间运行的函数将在运行时在后台进行编译,然后在某些时候将其替换在堆栈中(“ OSR”),这增加了各种噪声都会影响您的测量。当您使用不同的循环长度调用它们进行预热时,它们仍然会在后台进行编译,但是无法可靠地等待该后台作业。您可以诉诸用于开发的命令行标志,但是那样就不再测量常规行为。
无论如何,以下是尝试制作与您的测试类似的测试以产生合理的结果(在我的计算机上约为100 180 280
):
function Point() {}
// These three functions are identical, but they will be called with different
// inputs and hence collect different type feedback:
function processPointMonomorphic(N, point) {
let sum = 0;
for (let i = 0; i < N; i++) {
sum += point.a;
}
return sum;
}
function processPointPolymorphic(N, point) {
let sum = 0;
for (let i = 0; i < N; i++) {
sum += point.a;
}
return sum;
}
function processPointGeneric(N, point) {
let sum = 0;
for (let i = 0; i < N; i++) {
sum += point.a;
}
return sum;
}
let p1 = new Point();
let p2 = new Point();
let p3 = new Point();
let p4 = new Point();
const warmup = 12000;
const N = 100000000;
let sum = 0;
p1.a = 1;
p2.b = 1;
p2.a = 1;
p3.c = 1;
p3.b = 1;
p3.a = 1;
p4.d = 1;
p4.c = 1;
p4.b = 1;
p4.a = 1;
processPointMonomorphic(warmup, p1);
processPointMonomorphic(1, p1);
let start_1 = Date.now();
sum += processPointMonomorphic(N, p1);
let t1 = Date.now() - start_1;
processPointPolymorphic(2, p1);
processPointPolymorphic(2, p2);
processPointPolymorphic(2, p3);
processPointPolymorphic(warmup, p4);
processPointPolymorphic(1, p4);
let start_2 = Date.now();
sum += processPointPolymorphic(N, p1);
let t2 = Date.now() - start_2;
processPointGeneric(warmup, 1);
processPointGeneric(1, 1);
let start_3 = Date.now();
sum += processPointGeneric(N, p1);
let t3 = Date.now() - start_3;
console.log(t1, t2, t3);