以下代码应该在3.0
中找到存在的密钥std::map
。但是由于浮点精度,它将无法找到。
map<double, double> mymap;
mymap[3.0] = 1.0;
double t = 0.0;
for(int i = 0; i < 31; i++)
{
t += 0.1;
bool contains = (mymap.count(t) > 0);
}
在上面的示例中,contains
始终为false
。
我目前的解决方法是将t
乘以0.1而不是添加0.1,如下所示:
for(int i = 0; i < 31; i++)
{
t = 0.1 * i;
bool contains = (mymap.count(t) > 0);
}
现在的问题是:
如果我使用std::map
密钥,有没有办法将{Fuzzy}引入double
?
浮点数比较的常见解决方案通常类似于a-b < epsilon
。但我没有看到使用std::map
执行此操作的简单方法。
我是否真的必须在类中封装double
类型并覆盖operator<(...)
以实现此功能?
答案 0 :(得分:25)
因此,在std::map
中使用双精度键存在一些问题。
首先,NaN
比较自身是一个问题。如果有NaN
插入的可能性,请使用:
struct safe_double_less {
bool operator()(double left, double right) const {
bool leftNaN = std::isnan(left);
bool rightNaN = std::isnan(right);
if (leftNaN != rightNaN)
return leftNaN<rightNaN;
return left<right;
}
};
但这可能过于偏执。不要,我重复一遍,在你传递给std::set
之类的比较运算符中包含一个epsilon阈值:这将违反容器的排序要求,并导致不可预测的未定义行为。
(我的排序中NaN
比所有double
更多,包括+inf
,我没有充分的理由。少于所有double
也可以)。
因此要么使用默认的operator<
,要么使用上面的safe_double_less
或类似内容。
接下来,我建议使用std::multimap
或std::multiset
,因为您应该期望每次查找都有多个值。您也可以将内容管理作为日常事务而不是极端情况,以增加代码的测试覆盖率。 (我很少推荐这些容器)加上这个块operator[]
,当你使用浮点键时不建议使用它。
您要使用epsilon的点是您查询容器时。而不是使用直接接口,创建一个这样的辅助函数:
// works on both `const` and non-`const` associative containers:
template<class Container>
auto my_equal_range( Container&& container, double target, double epsilon = 0.00001 )
-> decltype( container.equal_range(target) )
{
auto lower = container.lower_bound( target-epsilon );
auto upper = container.upper_bound( target+epsilon );
return std::make_pair(lower, upper);
}
适用于std::map
和std::set
(以及multi
版本)。
(在一个更现代的代码库中,我希望range<?>
对象从equal_range
函数返回更好。但是现在,我将使它与{ {1}})。
这会找到一系列键,这些键的键与您要求的键“足够接近”,而容器在内部维护其排序保证,并且不执行未定义的行为。
要测试是否存在密钥,请执行以下操作:
equal_range
如果你想删除/替换条目,你应该处理可能有多个条目命中的可能性。
较短的答案是“不要将浮点值用作template<typename Container>
bool key_exists( Container const& container, double target, double epsilon = 0.00001 ) {
auto range = my_equal_range(container, target, epsilon);
return range.first != range.second;
}
和std::set
的键”,因为这有点麻烦。
如果你使用std::map
或std::set
的浮点键,几乎可以永远对它们执行std::map
或.find
,因为这很可能成为错误的来源。您可以将它用于自动排序的东西集合,只要确切的顺序无关紧要(即,一个特定的1.0位于前方或后方或与另一个1.0位于同一位置)。即使这样,我也会使用multimap / multiset,因为依赖于碰撞或缺乏碰撞不是我所依赖的。
有关IEEE浮点值精确值的推理很困难,而且依赖它的代码的脆弱性很常见。
答案 1 :(得分:4)
您可以实现自己的比较功能。
#include <functional>
class own_double_less : public std::binary_function<double,double,bool>
{
public:
own_double_less( double arg_ = 1e-7 ) : epsilon(arg_) {}
bool operator()( const double &left, const double &right ) const
{
// you can choose other way to make decision
// (The original version is: return left < right;)
return (abs(left - right) > epsilon) && (left < right);
}
double epsilon;
};
// your map:
map<double,double,own_double_less> mymap;
更新:请参阅Item 40 in Effective STL! 根据建议更新。
答案 2 :(得分:4)
作为Naszta says,您可以实现自己的比较功能。他遗漏的是使其发挥作用的关键 - 您必须确保函数始终返回false
以获取等效容差范围内的任何值。
return (abs(left - right) > epsilon) && (left < right);
编辑:正如对这个答案和其他人的许多评论所指出的那样,如果您提供的价值是任意分配的话,这种情况可能会很糟糕,因为您无法保证!(a<b)
和!(b<c)
会产生!(a<c)
。这个在问题中不会出现问题,因为所讨论的数字聚集在0.1左右的增量;只要你的epsilon足够大,可以解释所有可能的舍入误差但小于0.05,它就是可靠的。至关重要的是,地图的关键点永远不会超过2 * epsilon。
答案 3 :(得分:4)
这是一个简单的例子,说明如何使用软比较(aka epsilon或几乎相等)可能导致问题。
为简单起见,请epsilon = 2
。将1
和4
放入map
。它现在看起来像这样:
1
\
4
所以1
是树根。
现在按顺序输入数字2
,3
,4
。每个都将替换根,因为它比较等于它。那么你有
4
\
4
已经坏了。 (假设没有尝试重新平衡树。)我们可以继续使用5
,6
,7
:
7
\
4
并且这更加破碎,因为现在如果我们询问4
是否在那里,它会说&#34; no&#34;,如果我们要求迭代器的值小于{{ 1}},它不会包含7
。
虽然我必须说我过去多次使用基于这个有缺陷的模糊比较运算符的4
,并且每当我挖出一个错误时,它从来都不是由于此。这是因为我的应用领域中的数据集实际上从未真正对压力测试这个问题。
答案 4 :(得分:-2)
使用双精度作为键是没用的。只要对键进行任何算术运算,就不能确定它们具有哪些确切值,因此不能使用它们来索引地图。唯一明智的用法是键是不变的。