我正在尝试使用numpy在Python 2.7中实现一个简单的Markov Chain Monte Carlo。目标是找到“背包问题”的解决方案,其中给定一组具有值vi和重量wi的m个物体,以及具有容纳能力b的袋子,您可以找到可以放入包中的物体的最大价值,以及那些对象是什么。我在夏天开始编码,而且我的知识非常不平衡,所以如果我遗漏了一些明显的东西,我会道歉,我是自学成才并且一直在跳到那里。
系统的代码如下(我把它分成几部分,试图弄清楚出了什么问题)。
import numpy as np
import random
def flip_z(sackcontents):
##This picks a random object, and changes whether it's been selected or not.
pick=random.randint(0,len(sackcontents)-1)
clone_z=sackcontents
np.put(clone_z,pick,1-clone_z[pick])
return clone_z
def checkcompliance(checkedz,checkedweights,checkedsack):
##This checks to see whether a given configuration is overweight
weightVector=np.dot(checkedz,checkedweights)
weightSum=np.sum(weightVector)
if (weightSum > checkedsack):
return False
else:
return True
def getrandomz(length):
##I use this to get a random starting configuration.
##It's not really important, but it does remove the burden of choice.
z=np.array([])
for i in xrange(length):
if random.random() > 0.5:
z=np.append(z,1)
else:
z=np.append(z,0)
return z
def checkvalue(checkedz,checkedvalue):
##This checks how valuable a given configuration is.
wealthVector= np.dot(checkedz,checkedvalue)
wealthsum= np.sum(wealthVector)
return wealthsum
def McKnapsack(weights, values, iterations,sack):
z_start=getrandomz(len(weights))
z=z_start
moneyrecord=0.
zrecord=np.array(["error if you see me"])
failures=0.
for x in xrange(iterations):
current_z= np.array ([])
current_z=flip_z(z)
current_clone=current_z
if (checkcompliance(current_clone,weights,sack))==True:
z=current_clone
if checkvalue(current_z,values)>moneyrecord:
moneyrecord=checkvalue(current_clone,values)
zrecord= current_clone
else:failures+=1
print "The winning knapsack configuration is %s" %(zrecord)
print "The highest value of objects contained is %s" %(moneyrecord)
testvalues1=np.array([3,8,6])
testweights1= np.array([1,2,1])
McKnapsack(testweights1,testvalues1,60,2.)
应该发生的情况如下:最大承载能力为2时,应在不同潜在的行李携带配置之间随机切换,其中有2 ^ 3 = 8的测试重量和值我喂它,z中的每一个或零表示具有或不具有给定项目。它应该丢弃具有太多重量的选项,同时跟踪具有最高值和可接受重量的选项。正确的答案是将1,0,1视为配置,其中9为最大值。每当我使用甚至中等量的迭代时,我得到九个值,但配置似乎完全随机,并以某种方式打破了权重规则。我用大量的测试数组仔细检查了我的“checkcompliance”函数,它似乎工作正常。这些错误的超重配置如何通过我的if语句并进入我的zrecord?
答案 0 :(得分:2)
诀窍是z
(因此current_z
以及zrecord
)总是指向内存中完全相同的对象。 flip_z
通过np.put
就地修改此对象。
一旦找到增加moneyrecord
的新组合,就会设置对它的引用 - 但是在随后的迭代中,您将继续并在同一参考处更改数据。
换句话说,像
这样的行current_clone=current_z
zrecord= current_clone
不要复制,它们只为内存中的相同数据制作另一个别名。
解决此问题的一种方法是,一旦您发现它是赢家,就明确复制该组合:
if checkvalue(current_z, values) > moneyrecord:
moneyrecord = checkvalue(current_clone, values)
zrecord = current_clone.copy()