假设我有多项式f(x) = x^n + x + a
。我为n
设置了一个值,并想要0 <= a <= A
,其中A
是我设置的其他值。这意味着我将总共拥有A
个不同的多项式,因为a
可以是0
和A
之间的任何值。
使用Sage,我发现了这些A多项式的可约数。例如,假设我设置了n=5
和A=10^7
。这将告诉我这些5级10^7
多项式中有多少是可约的。我使用循环完成此操作,该循环适用于A
的低值。但是对于我需要的较大值(即A=10^7
),这将花费非常长且不切实际的时间。代码如下。有人可以帮我有意义地优化它吗?
x = polygen(QQ)
n = 5
A = 10^7
count = 0
for i in range(A):
p_pol = x^n + x + i
if not p_pol.is_irreducible():
count = count + 1
print(i)
print('Count:' + str(count))
答案 0 :(得分:1)
一个很小的例子,但是在这种情况下,毫无意义的优化是将range(A)
替换为xrange(A)
。前者将创建一个从0
到A - 1
的所有整数的数组,这是浪费时间和空间的。 xrange(A)
只会一一生成整数,并在完成后将其丢弃。 Sage 9.0默认基于Python 3,其中range
等效于xrange
。
我们还是做一些实验。另一个小优化是预定义多项式在每个循环中恒定的部分:
x = polygen(QQ)
n = 5
A = 10^7
base = x^n + x
现在,作为一般测试,让我们看看在某些情况下将整数添加到多项式然后计算其不可约性需要多长时间:
sage: (base + 1).is_irreducible()
False
sage: %timeit (base + 1).is_irreducible()
1000 loops, best of 3: 744 µs per loop
sage: (base + 3).is_irreducible()
True
sage: %timeit (base + 3).is_irreducible()
1000 loops, best of 3: 387 µs per loop
因此,在不可约的情况下(它将是大多数),它似乎要快一些,因此,平均而言,这将花费387µs。然后:
sage: 0.000387 * 10^7 / 60
64.5000000000000
因此,平均(在我的计算机上)这仍然需要一个多小时。
如果您有许多CPU内核,可以加快速度的一件事就是对其进行并行化。例如:
x = polygen(QQ)
A = 10^7
def is_irreducible(i, base=(x^5 + x)):
return (base + i).is_irreducible()
from multiprocessing import Pool
pool = Pool()
A - sum(pool.map(is_irreducible, xrange(A)))
原则上,这将给您相同的结果。虽然您获得的速度最多只能达到您最多拥有的CPU数量(通常少一些)。 Sage还附带了一些parallelization helpers,但对于在较大值范围内加快小型计算速度的情况,我倾向于发现它们有点缺乏(它们可以使用 ,但这需要一些照顾,例如手动批处理您的输入;我对此并不疯狂……)
除此之外,您可能需要使用一些数学直觉来尝试减少问题空间。