我有一个项目,我被要求开发一个应用程序来模拟不同页面替换算法的执行方式(具有不同的工作集大小和稳定期)。我的结果:
我的结果合理吗?我期望LRU比FIFO更好。在这里,它们大致相同。
对于随机性,稳定期和工作集大小似乎根本不影响性能?我期待类似的图表如FIFO& LRU表现最差?如果引用字符串是高度稳定的(小分支)并且具有较小的工作集大小,那么具有许多分支和大工作集大小的应用程序应该仍然具有较少的页面错误?
更多信息
My Python Code | The Project Question
工作集大小(e)& stable period(t)会影响引用字符串的生成方式。
|-----------|--------|------------------------------------|
0 p p+e P-1
假设上面是大小为P的虚拟内存。要生成参考字符串,使用以下算法:
m
个数字。 m
模拟或引用页面被引用的次数更新(回应@ MrGomez的回答)
但是,请回想一下您如何播种输入数据:使用random.random, 从而为您提供可控制的统一数据分布 熵水平。因此,所有价值都同样可能 发生了,因为你在浮点空间构建了这个, 复发是非常不可能的。
我正在使用random
,但它也不是完全随机的,虽然使用工作集大小和数字页引用参数,但是通过使用某些位置生成引用?
我尝试用numPageReferenced
增加numFrames
亲戚,希望它能更多地引用当前在内存中的页面,从而显示LRU优于FIFO的性能优势,但这并没有给我一个结果很清楚。仅供参考,我尝试使用以下参数的同一个应用程序(页面/框架比率仍然保持不变,我减少了数据的大小以使事情更快)。
--numReferences 1000 --numPages 100 --numFrames 10 --numPageReferenced 20
结果是
仍然没有那么大的差异。我是否正确地说,如果相对于numPageReferenced
增加numFrames
,LRU应该有更好的性能,因为它更多地引用内存中的页面?或许我错误地理解了什么?
对于随机,我正在思考:
嗯,也许我要考虑更多:)
更新:在较低的稳定性下不那么明显的垃圾
在这里,我试图显示垃圾,因为工作集大小超过内存中的帧数(100)。然而,通知颠簸似乎不太明显,稳定性较低(高t
),为什么会这样?解释是,当稳定性变低时,页面错误接近最大值,因此工作集大小是多少并不重要?
答案 0 :(得分:12)
根据您当前的实施情况,这些结果是合理的。然而,背后的基本原理还有一些讨论。
在考虑一般算法时,最重要的是考虑当前正在检查的算法的属性。具体来说,请注意他们的corner cases以及最佳和最差情况。你可能已经熟悉了这种简洁的评估方法,所以这主要是为了那些阅读时可能没有算法背景的人的利益。
让我们按算法分解你的问题,并在上下文中探索它们的组件属性:
FIFO 表示随着工作集(长度轴)的大小增加,页面错误会增加。
这是正确的行为,与FIFO替换的Bélády's anomaly一致。随着工作页面集的大小增加,页面错误的数量也应该增加。
FIFO 显示页面错误增加,因为系统稳定性( 1 - 深度轴)减少。
注意您的播种稳定性算法(if random.random() < stability
),随着稳定性( S )接近1,您的结果将变得 稳定。当您急剧增加{时{3}}在您的数据中,页面错误的数量也会急剧增加并传播Bélády的异常。
到目前为止,非常好。
LRU 显示与 FIFO 的一致性。为什么呢?
请注意您的播种算法。如果您的分页请求结构化为较小的操作帧,则entropy是最佳选择。对于有序的,可预测的查找,它通过老化当前执行帧中不再存在的结果来改进FIFO ,这对于分阶段执行和封装的模态操作是非常有用的属性。再一次,到目前为止,这么好。
但是,请回想一下您如何播种输入数据:使用random.random
,从而为您提供具有可控熵级别的 Standard LRU 数据。因此,所有值都可能同样发生,并且因为您在uniform distribution中构造了这些值,所以重现非常不可能。
因此,您的 LRU 感知每个元素发生的次数很少,然后在计算下一个值时完全丢弃。因此,它可以正确地将每个值从页面中删除,从而使您的性能与 FIFO 完全相同。如果您的系统正确地考虑了重复或压缩的字符空间,您会看到明显不同的结果。
对于随机,稳定期和工作集大小似乎根本不会影响性能。为什么我们在图表上看到这个涂鸦而不是给我们一个相对floating point space?
对于随机分页方案,您可以使每个条目smooth manifold老化。据称,这应该给我们一些形式的歧管与我们的工作集的熵和大小绑定......对吗?
还是应该呢?对于每组条目,您随机分配一个子集作为时间的函数进行分页。无论稳定性如何,只要您的访问配置文件再次均匀随机,这应该可以提供相对均匀的分页性能。
因此,根据您正在检查的条件,这是完全正确的行为stochastically。您可以获得均匀的分页性能,这种性能不会因其他因素而降低(但相反,它们并未得到改善),这些因素适用于高负载,高效运行。不错,不是你可能直觉所期望的。
因此,简而言之,这就是您的项目目前正在实施的细分。
作为在输入数据的不同配置和分布的背景下进一步探索这些算法的属性的练习,我强烈建议深入研究consistent with what we'd expect以查看例如高斯或逻辑分布可能做什么到每个图表。然后,我会回到scipy.stats
并起草案例,其中每个案例都是最独特和最不合适的。
总而言之,我认为你的老师会感到自豪。 :)