R中具有极小值的算术

时间:2019-03-20 07:45:46

标签: r precision arbitrary-precision

在计算向量的cumsum()时,我面临着一个大问题。向量的长度约为10,000个元素,从2000个元素开始,值下降到1e-310。为了让我感觉到我正在处理的分布,这是一个情节。

sorted distribution

当我尝试申请cumsum()时,我得到很多,这是不可能的,最小值约为10 ^ -2。我正在移植我们在Matlab中开发的代码,当然那里没有问题。由于某些原因,R似乎很难处理如此小的数字,以致于应用标准函数返回的结果是出乎意料的错误。

我搜索了堆栈溢出,发现了这两篇文章:

  1. R: Number precision, how to prevent rounding?
  2. Controlling number of decimal digits in print output in R

不幸的是,他们都没有帮助我。

我也尝试使用 Rcpp cumsum()函数,但没有运气。我猜问题出在我的矩阵对象的精度上。

我什至不确定如何重现此图像,因此很高兴分享9137 x 2矩阵。我完全被这个困扰。

期待您的来信!
谢谢

更新

这是我矩阵中100个元素的样本:

y <- sample( BestPair, 100 )
dput( y )

c(7.74958917761984e-289, 4.19283869686715e-319, 1.52834266884531e-319, 
2.22089175309335e-297, 4.93980517192742e-298, 1.37861543592719e-301, 
1.47044459800611e-317, 6.49068860911021e-319, 1.83302927898675e-305, 
8.39514422452147e-312, 2.88487711616485e-300, 0.000544461085044608, 
0.000435738736513519, 1.35649914843994e-309, 4.30826678309556e-310, 
2.60728322623343e-319, 0.000544460617547516, 5.28815204888643e-299, 
0.00102710912090133, 0.00198425117943324, 1.99711912768841e-304, 
8.34594499227505e-306, 7.42055412763084e-300, 5.00039717762739e-311, 
1.8750204972032e-305, 1.06513324565406e-310, 5.00487443690634e-313, 
3.4890421843663e-319, 7.48945537292364e-310, 1.92948452007191e-310, 
1.19840058299897e-305, 0.000532438536688165, 6.53966533658245e-318, 
0.000499821676385928, 2.02305525482572e-305, 5.18981575493413e-306, 
8.82648276295387e-320, 7.30476057376283e-320, 1.23073492422415e-291, 
4.1801705284367e-311, 5.10863383734203e-318, 1.12106998189819e-298, 
9.34823978505262e-297, 0.00093615863896107, 5.3667092510628e-311, 
3.85094526994501e-319, 1.3693720559483e-313, 3.96230943126873e-311, 
2.03293191294298e-319, 2.38607510351427e-291, 0.000544460855322345, 
1.74738584846597e-310, 1.41874408662835e-318, 5.73056861298345e-319, 
3.28565325597139e-302, 3.5412805275117e-310, 1.19647007227024e-302, 
1.71539915106223e-305, 2.10738303243284e-311, 6.47783846432427e-313, 
5.0072402480979e-303, 7.7250380240544e-303, 9.75451890703679e-309, 
0.000533945755492525, 0.00211359631486468, 1.6612179399628e-312, 
0.000521804571338402, 4.12194185271951e-308, 1.12829365794294e-313, 
8.89772702908418e-319, 5.092756929242e-312, 7.45208240537024e-311, 
6.60385177095196e-298, 0.000544461017733648, 1.62108867188263e-318, 
3.95135528339003e-309, 1.8792966379072e-292, 5.98494480819088e-295, 
0.00051614492665081, 2.25198141886419e-300, 7.97467977809552e-305, 
1.78098757558338e-311, 1.66946525895122e-313, 0.000778442249425894, 
6.58100207570114e-312, 0.00120733768329515, 3.44432924341767e-319, 
6.38151190880713e-313, 7.1129669216109e-300, 4.11319531475755e-319, 
7.21747577033383e-304, 1.48709312807403e-318, 1.39519898470211e-303, 
4.58585270141592e-312, 2.16309869205282e-295, 7.55248601743105e-314, 
3.16365476892733e-310, 1.96961507010996e-305, 3.21125377499206e-318, 
3.66277772043574e-304)

更新2

显然,施加了以下条件:

BestPair[ BestPair < .Machine$double.eps ] <- 0

不能解决问题。仍然从cumsum()中发现奇怪的结果。这是一个图,可以更好地解释我正在处理的内容。累积概率。之所以具有这种形状,是因为BestPair已按降序排序。我想在向量的上方放置cumsum()中的1。

enter image description here

以下是对象摘要

> summary(CumProb)
## Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.0250  1.0000  1.0000  0.9685  1.0000  1.0000 

更新3. Matlab的结果

这是用Matlab计算的结果。如您所见,即使截断原始矩阵,我也可以获得相当不错的R分布。

enter image description here

0 个答案:

没有答案