Question

最近我必须处理具有很多长符号表达式的算法，比如这个

upperside = (    e * e * n * p * tn * tn + 
             2 * e * e * n * p * tn * tp +  
                 e * e * n * p * tp * tp + 
             2 * e * n * n * p * te * tn + 
             2 * e * n * n * p * te * tp +
                 N * e * n * n * tp * tp + 
             2 * e * n * p * p * te * tn +
             2 * e * n * p * p * te * tp - 
             2 * N * e * n * p * tn * tp + 
                 N * e * p * p * tn * tn +
                 n * n * n * p * te * te + 
             2 * n * n * p * p * te * te + 
                 n * p * p * p * te * te)

remformated

upperside = (        e * e * n         * p                  * tn * tn           + 
             2     * e * e * n         * p                  * tn      * tp      +  
                     e * e * n         * p                            * tp * tp + 
             2     * e     * n * n     * p         * te     * tn                + 
             2     * e     * n * n     * p         * te               * tp      +
                 N * e     * n * n                                    * tp * tp + 
             2     * e     * n         * p * p     * te     * tn                +
             2     * e     * n         * p * p     * te               * tp      - 
             2 * N * e     * n         * p                  * tn      * tp      + 
                 N * e                 * p * p              * tn * tn           +
                             n * n * n * p         * te * te                    + 
             2             * n * n     * p * p     * te * te                    + 
                             n         * p * p * p * te * te)

这些表达式是在简化后从MATLAB符号例程派生的。很明显，在这种情况下，不可能通过例如合并因子来简化代数表达。但是，似乎很可能简化此表达式，以便大大减少实际操作数。不幸的是，我无法在MATLAB或Python中找到这样的选项。

感谢任何帮助。

修改目标是最小化CPU需要为此类表达式执行的操作。由于操作只涉及加法和乘法，我希望得到类似（e + tn）*（te + tp）+ n + ......的东西。我试图将表达式考虑在内但不幸的是表达式是不可分解的。

Answer 1

如果任何python包可以提供帮助，那么它可能是Sympy：

from sympy import init_printing, symbols, simplify, collect, factor

e,n,p,tn,te,tp,N = symbols("e,n,p,tn,te,tp,N")

upperside = (e * e * n * p * tn * tn + 
         2 * e * e * n * p * tn * tp +
             e * e * n * p * tp * tp + 
         2 * e * n * n * p * te * tn + 
         2 * e * n * n * p * te * tp +
             N * e * n * n * tp * tp + 
         2 * e * n * p * p * te * tn +
         2 * e * n * p * p * te * tp - 
         2 * N * e * n * p * tn * tp + 
             N * e * p * p * tn * tn +
             n * n * n * p * te * te + 
         2 * n * n * p * p * te * te + 
             n * p * p * p * te * te)

print collect(upperside, e*n)

输出：

N*e*p**2*tn**2 + 
e**2*n*(p*tn**2 + 2*p*tn*tp + p*tp**2) + 
e*n**2*(N*tp**2 + 2*p*te*tn + 2*p*te*tp) + 
e*n*(-2*N*p*tn*tp + 2*p**2*te*tn + 2*p**2*te*tp) + 
n**3*p*te**2 + 
2*n**2*p**2*te**2 + 
n*p**3*te**2

在此page中描述的所有方法中，collect看起来最有希望。

这是一种快速而又脏的方法来迭代所有符号组合并显示找到的最短表达式：

from sympy import init_printing, symbols, collect, pprint
import itertools

init_printing()

e,n,p,tn,te,tp,big_n = symbols("e,n,p,tn,te,tp,big_n")

upperside = (e * e * n * p * tn * tn + 2 * e * e * n * p * tn * tp +
                 e * e * n * p * tp * tp + 2 * e * n * n * p * te * tn + 2 * e * n * n * p * te * tp +
                 big_n * e * n * n * tp * tp + 2 * e * n * p * p * te * tn +
                 2 * e * n * p * p * te * tp - 2 * big_n * e * n * p * tn * tp + big_n * e * p * p * tn * tn +
                 n * n * n * p * te * te + 2 * n * n * p * p * te * te + n * p * p * p * te * te)

my_symbols = [e, n, p, tn, te, tp, big_n]

min_length = float('inf')

for i in range(len(my_symbols)):
  for symbol_subsets in itertools.combinations(my_symbols, i+1):
      collect_by = '*'.join(str(symbol) for symbol in symbol_subsets)
      expression = collect(upperside, collect_by)
      length = len(str(expression))
      if length < min_length:
          min_length = length
          print "With '%s' :" % collect_by
          pprint(expression)
          print

输出：

With 'e' :
e**2*(n*p*tn**2 + 2*n*p*tn*tp + n*p*tp**2) + e*(big_n*n**2*tp**2 - 2*big_n*n*p*tn*tp + big_n*p**2*tn**2 + 2*n**2*p*te*tn + 2*n**2*p*te*tp + 2*n*p**2*te*tn + 2*n*p**2*te*tp) + n**3*p*te**2 + 2*n**2*p**2*te**2 + n*p**3*te**2

With 'n' :
big_n*e*p**2*tn**2 + n**3*p*te**2 + n**2*(big_n*e*tp**2 + 2*e*p*te*tn + 2*e*p*te*tp + 2*p**2*te**2) + n*(-2*big_n*e*p*tn*tp + e**2*p*tn**2 + 2*e**2*p*tn*tp + e**2*p*tp**2 + 2*e*p**2*te*tn + 2*e*p**2*te*tp + p**3*te**2)

With 'e*n' :
big_n*e*p**2*tn**2 + e**2*n*(p*tn**2 + 2*p*tn*tp + p*tp**2) + e*n**2*(big_n*tp**2 + 2*p*te*tn + 2*p*te*tp) + e*n*(-2*big_n*p*tn*tp + 2*p**2*te*tn + 2*p**2*te*tp) + n**3*p*te**2 + 2*n**2*p**2*te**2 + n*p**3*te**2

With 'e*n*p' :
big_n*e*n**2*tp**2 - 2*big_n*e*n*p*tn*tp + big_n*e*p**2*tn**2 + e**2*n*p*(tn**2 + 2*tn*tp + tp**2) + e*n**2*p*(2*te*tn + 2*te*tp) + e*n*p**2*(2*te*tn + 2*te*tp) + n**3*p*te**2 + 2*n**2*p**2*te**2 + n*p**3*te**2

Answer 2

公共子表达式消除（或sympy cse）计算乘积，例如：e e和e p以及加法。这有助于找到一个非常好的优化表达式。我用3种不同的数学方法看到了一个巨大的表达式，计算时间也大不相同。使用cse之后，这3种配方的计算时间几乎相同。而且某些重要因素要比最快的非优化算法更快。

符号简化为加号和乘法运算的最少数量

2 个答案: