应用错误收集

编辑：我本质上已经将其重写为（希望）更加清晰和简洁。这是新版本，然后是原始版本。

我目前正在使用TensorFlow来解决物理优化问题（物理细节/背景基本上无关紧要，不过如果您有兴趣并了解专业术语，请参阅下文）。实际上，这与机器学习无关。我只是使用TF进行自动区分。

因此，可以说，用损失函数L（x 1 ，x ₂，...，x _N sub> 1 ，x ₂，...，x _N）。我的问题是L（x ₁，x ₂，...，x _N）无法精确有效地计算；但是，可以通过采样来近似。也就是说，L（x ₁，x ₂，...，x _N）几乎等于：

l（x ₁，x ₂，...，x _N）=Σ_iλ _i（x ₁，x ₂，...，x _N）

其中每个λ_i可以得到有效计算。但是，每个λ_i的形式都取决于x ₁，x ₂，...，x的当前值。 _N。也就是说，采样不是“随机”的，而是根据参数的当前值以受控方式进行的。

对于优化问题，其想法是使用l代替L作为成本函数。复杂的是，l每次迭代都会更改（或ML术语中的“ epoch”）。因此，算法为：

在每个时期：

从l = 0开始; l作为x _k的函数的形式在这一点上是未知的
确定λ₁的形式。然后评估λ₁（并自动计算∂λ₁ /∂x_k）
在定义和评估l的过程中对i求和（并自动∂l/∂x_k）。
根据导数> l _i /∂x_{更新x ₁，...，x _N k}。

我不确定如何在TensorFlow中处理此问题，因为“ if”语句不起作用。我知道有TensorFlow条件语句（tf.cond），但是我遇到了各种各样的问题，我甚至不确定这是否是使用tf.cond的正确位置。 PyTorch会更好吗？

[在物理学背景上：我正在寻找量子自旋系统的基态；损失函数是能量，我正在使用变分蒙特卡罗方法进行计算。我所谓的λ_i是某种自旋结构的局部能量。然后翻转随机自旋，并以概率=波函数振幅的比率接受此新的自旋配置。 λ_{i + 1}是新自旋结构的局部能量，依此类推。]

原始版本：基本上，问题是我的损失函数不是严格定义的，而是每次迭代都会更改。

这是怎么产生的：假设我要优化的变量是x ₁，x ₂，...，x _N，损失函数是L（x ₁，x ₂，...，x _N）。在我正在处理的问题中，要精确计算L（x ₁，x ₂，...，x _N）会涉及做一个很大的和，所以唯一的方法是通过以下方法计算L（x ₁，x ₂，...，x _N）蒙特卡洛采样方法。具体来说，该方法是马尔可夫链蒙特卡罗方法（即顺序采样）。

实际上，我的情况基本上是：

使用采样方法，我有类似L（x ₁，...，x _N）= L ₁（x _{i ¹ ₁}，...，x _{i ¹ _n}）+ L ₂（x _{i ² ₁}，...，x _{i ² _n}）+ ... + L _M（x _{i ^M ₁}，...，x _{i ^M _n}）。重要的是，函数L ₁，L ₂，...并不是一成不变的（既从功能形式上，又从哪个子集上它们所依赖的变量）。为了计算L，一个拳头从L ₁开始（基本上，设置了L _k的一般形式，但保留了一些自由参数。通常，我们以“随机” L ₁）。然后，我们通过随机生成其中的自由参数来生成L ₂“候选”。然后根据x ₁ ... _N变量的一些量的值来接受或拒绝该变量。一旦找到L ₂，就对其求值并添加到总L中，然后我们移至L ₃，依此类推。为了再次计算L，重复整个过程。

为了优化，整个过程在每个迭代（或ML术语中的“ epoch”）中重复进行。即使L的精确功能形式在每个时期之间都不同，对于x ₁，...，x _N的任何给定值，L（x < sub> 1 ，...，x _N）定义得很好（在近似的精度范围内），因此优化仍应收敛。

问题是：在TensorFlow中可以做到这一点吗？使用if语句编写常规Python代码来评估L（x ₁，...，x _N）很容易，但这并不能很好地转化为TensorFlow 。 PyTorch会更好吗？

首先，可以通过pyMC3和tensorflow-probability之类的库使用MCMC。出色的Probabilistic Programming and Bayesian Methods for Hackers中提供了两个框架的动手示例。

关于您的实际计算，我不确定是否遵循。通常，通过随机采样进行的反向传播有两种主要方式：路径导数和得分函数。尽管您也许可以找到更好的资源，但两者都在PyTorch documentation中进行了简要描述。由于路径空间的大小，我认为您的问题不适合使用逐阶导数，而且不确定分数函数是否也可以工作。

一个期望值最大化的方法是一个可能可行的想法，但如果没有其他知识我就无法判断。以下是否可能解决您的问题？

从您的马尔可夫链[S1, ..., SN]中提取N个样本（期望）
计算损失L(S1) + ... + L(SN)，对其进行最小化（最小化）
重复

Tensorflow（或Pytorch？），其成本函数是根据Monte Carlo采样定义的（成本函数在每个时期都会改变）

1 个答案: