[底部更新(包括解决方案源代码)]
我有一个具有挑战性的业务问题,计算机可以帮助解决。
沿着山区流动着一条长长的蜿蜒河流,水流强劲。沿河的某些部分是环境敏感的土地,适合种植特别需要的特殊类型的稀有水果。一旦田间工人收获果实,时钟开始滴答作响,将水果送到加工厂。尝试将水果送到上游或陆地或空中是非常昂贵的。到目前为止,将它们运送到工厂的最具成本效益的机制是在仅由河流恒定电流驱动的集装箱的下游。我们有能力建造10个加工厂,并需要在河边找到这些加工厂,以尽量减少水果在运输过程中的总时间。在到达最近的下游工厂之前,水果可能需要很长时间,但那段时间会直接损害它们的销售价格。实际上,我们希望最小化到最近的相应下游工厂的距离之和。植物可以位于水果接入点下游0米处。
问题是:为了最大化利润,如果我们找到了32个水果种植区域,那么我们应该在多长的河流上建造10个加工厂,这些区域距离河流基地的上游距离(以米为单位) ): 10,40,90,160,250,360,490,...(n ^ 2)* 10 ... 9000,9610,10320?
[希望所有致力于解决这个问题以及创建类似问题和使用场景的工作有助于提高人们对软件/商业方法专利的破坏性和令人窒息的性质的认识并产生普遍的抵制(无论如何)这些专利可能被认为在一个地方是合法的。)
更新
Update1:忘记添加:我认为这个问题是this one的一个特例。
Update2:我写的一个算法在不到一秒的时间内给出了一个答案,我相信它相当不错(但它在样本值上并不稳定)。我稍后会提供更多细节,但简短如下。将植物放置在相等的间距。循环遍历每个植物的所有内部植物,通过测试其两个邻居之间的每个位置来重新计算其位置,直到问题在该空间内得到解决(贪婪算法)。因此,优化植物2保持1和3固定。然后工厂3保持2和4固定...当你到达终点时,你循环回来重复,直到你进入一个完整的周期,每个加工厂的重新计算的位置停止变化..也在每个周期结束时,你试图移动加工厂彼此相邻拥挤,彼此靠近的水果堆放到一个远处有水果堆的区域。有很多方法可以改变细节,从而产生确切的答案。我有其他候选算法,但都有毛刺。 [我稍后会发布代码。]正如Mike Dunlavey在下面提到的,我们可能只是想要“足够好”。
要了解什么可能是“足够好”的结果:
10010 total length of travel from 32 locations to plants at
{10,490,1210,1960,2890,4000,5290,6760,8410,9610}
Update3:mhum首先给出了正确的确切解决方案,但没有(还)发布一个程序或算法,所以我写了一个产生相同值的。
/************************************************************
This program can be compiled and run (eg, on Linux):
$ gcc -std=c99 processing-plants.c -o processing-plants
$ ./processing-plants
************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
//a: Data set of values. Add extra large number at the end
int a[]={
10,40,90,160,250,360,490,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240,99999
};
//numofa: size of data set
int numofa=sizeof(a)/sizeof(int);
//a2: will hold (pt to) unique data from a and in sorted order.
int *a2;
//max: size of a2
int max;
//num_fixed_loc: at 10 gives the solution for 10 plants
int num_fixed_loc;
//xx: holds index values of a2 from the lowest error winner of each cycle memoized. accessed via memoized offset value. Winner is based off lowest error sum from left boundary upto right ending boundary.
//FIX: to be dynamically sized.
int xx[1000000];
//xx_last: how much of xx has been used up
int xx_last=0;
//SavedBundle: data type to "hold" memoized values needed (total traval distance and plant locations)
typedef struct _SavedBundle {
long e;
int xx_offset;
} SavedBundle;
//sb: (pts to) lookup table of all calculated values memoized
SavedBundle *sb; //holds winning values being memoized
//Sort in increasing order.
int sortfunc (const void *a, const void *b) {
return (*(int *)a - *(int *)b);
}
/****************************
Most interesting code in here
****************************/
long full_memh(int l, int n) {
long e;
long e_min=-1;
int ti;
if (sb[l*max+n].e) {
return sb[l*max+n].e; //convenience passing
}
for (int i=l+1; i<max-1; i++) {
e=0;
//sum first part
for (int j=l+1; j<i; j++) {
e+=a2[j]-a2[l];
}
//sum second part
if (n!=1) //general case, recursively
e+=full_memh(i, n-1);
else //base case, iteratively
for (int j=i+1; j<max-1; j++) {
e+=a2[j]-a2[i];
}
if (e_min==-1) {
e_min=e;
ti=i;
}
if (e<e_min) {
e_min=e;
ti=i;
}
}
sb[l*max+n].e=e_min;
sb[l*max+n].xx_offset=xx_last;
xx[xx_last]=ti; //later add a test or a realloc, etc, if approp
for (int i=0; i<n-1; i++) {
xx[xx_last+(i+1)]=xx[sb[ti*max+(n-1)].xx_offset+i];
}
xx_last+=n;
return e_min;
}
/*************************************************************
Call to calculate and print results for given number of plants
*************************************************************/
int full_memoization(int num_fixed_loc) {
char *str;
long errorsum; //for convenience
//Call recursive workhorse
errorsum=full_memh(0, num_fixed_loc-2);
//Now print
str=(char *) malloc(num_fixed_loc*20+100);
sprintf (str,"\n%4d %6d {%d,",num_fixed_loc-1,errorsum,a2[0]);
for (int i=0; i<num_fixed_loc-2; i++)
sprintf (str+strlen(str),"%d%c",a2[ xx[ sb[0*max+(num_fixed_loc-2)].xx_offset+i ] ], (i<num_fixed_loc-3)?',':'}');
printf ("%s",str);
return 0;
}
/**************************************************
Initialize and call for plant numbers of many sizes
**************************************************/
int main (int x, char **y) {
int t;
int i2;
qsort(a,numofa,sizeof(int),sortfunc);
t=1;
for (int i=1; i<numofa; i++)
if (a[i]!=a[i-1])
t++;
max=t;
i2=1;
a2=(int *)malloc(sizeof(int)*t);
a2[0]=a[0];
for (int i=1; i<numofa; i++)
if (a[i]!=a[i-1]) {
a2[i2++]=a[i];
}
sb = (SavedBundle *)calloc(sizeof(SavedBundle),max*max);
for (int i=3; i<=max; i++) {
full_memoization(i);
}
free(sb);
return 0;
}
答案 0 :(得分:2)
让我举一个Metropolis-Hastings算法的简单示例。 假设您有一个状态向量 x ,以及一个拟合优度函数 P(x),它可以是您要写的任何函数。
假设您有一个随机分布 Q 可用于修改向量,例如x' = x + N(0, 1) * sigma
,其中N是关于0的简单正态分布, sigma < / em>是您选择的标准偏差。
p = P(x);
for (/* a lot of iterations */){
// add x to a sample array
// get the next sample
x' = x + N(0,1) * sigma;
p' = P(x');
// if it is better, accept it
if (p' > p){
x = x';
p = p';
}
// if it is not better
else {
// maybe accept it anyway
if (Uniform(0,1) < (p' / p)){
x = x';
p = p';
}
}
}
通常可以使用大约1000次循环的老化时间,然后开始收集样品。经过另外10,000次循环后,样本的平均值就是您的答案。
它需要诊断和调整。通常情况下,样本被绘制,你正在寻找的是一个“模糊的caterpilar”图,它是稳定的(不会移动很多)并且具有很高的接受率(非常模糊)。您可以使用的主要参数是 sigma 。 如果 sigma 太小,情节将会模糊,但它会四处漂移。 如果它太大,则图形将不会模糊 - 它将具有水平线段。 通常,起始向量 x 是随机选择的,通常会选择多个起始向量,以查看它们是否最终位于同一位置。
无需同时更改状态向量 x 的所有组件。你可以循环浏览它们,一次改变一个,或者一些这样的方法。
此外,如果您不需要诊断图,则可能没有必要保存样本,而只是动态计算平均值和方差。
在我熟悉的应用程序中,P(x)是概率的度量,它通常在对数空间中,因此它可以在0到负无穷大之间变化。
然后执行“可能接受”步骤(exp(logp' - logp))
答案 1 :(得分:1)
除非我犯了错误,否则这里是确切的解决方案(通过dynamic programming方法获得):
N Dist Sites
2 60950 {10,4840}
3 40910 {10,2890,6760}
4 30270 {10,2250,4840,7840}
5 23650 {10,1690,3610,5760,8410}
6 19170 {10,1210,2560,4410,6250,8410}
7 15840 {10,1000,2250,3610,5290,7290,9000}
8 13330 {10,810,1960,3240,4410,5760,7290,9000}
9 11460 {10,810,1690,2890,4000,5290,6760,8410,9610}
10 9850 {10,640,1440,2250,3240,4410,5760,7290,8410,9610}
11 8460 {10,640,1440,2250,3240,4410,5290,6250,7290,8410,9610}
12 7350 {10,490,1210,1960,2890,3610,4410,5290,6250,7290,8410,9610}
13 6470 {10,490,1000,1690,2250,2890,3610,4410,5290,6250,7290,8410,9610}
14 5800 {10,360,810,1440,1960,2560,3240,4000,4840,5760,6760,7840,9000,10240}
15 5190 {10,360,810,1440,1960,2560,3240,4000,4840,5760,6760,7840,9000,9610,10240}
16 4610 {10,360,810,1210,1690,2250,2890,3610,4410,5290,6250,7290,8410,9000,9610,10240}
17 4060 {10,360,810,1210,1690,2250,2890,3610,4410,5290,6250,7290,7840,8410,9000,9610,10240}
18 3550 {10,360,810,1210,1690,2250,2890,3610,4410,5290,6250,6760,7290,7840,8410,9000,9610,10240}
19 3080 {10,360,810,1210,1690,2250,2890,3610,4410,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
20 2640 {10,250,640,1000,1440,1960,2560,3240,4000,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
21 2230 {10,250,640,1000,1440,1960,2560,3240,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
22 1860 {10,250,640,1000,1440,1960,2560,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
23 1520 {10,250,490,810,1210,1690,2250,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
24 1210 {10,250,490,810,1210,1690,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
25 940 {10,250,490,810,1210,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
26 710 {10,160,360,640,1000,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
27 500 {10,160,360,640,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
28 330 {10,160,360,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
29 200 {10,160,360,490,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
30 100 {10,90,250,360,490,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
31 30 {10,90,160,250,360,490,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}
32 0 {10,40,90,160,250,360,490,640,810,1000,1210,1440,1690,1960,2250,2560,2890,3240,3610,4000,4410,4840,5290,5760,6250,6760,7290,7840,8410,9000,9610,10240}