操作员返回的指针的有效性 - >

时间:2017-06-26 11:17:03

标签: c++ iterator containers unique-ptr

我正在实现一个二维数组容器(如boost::multi_array<T,2>,主要用于练习)。为了使用双索引表示法(a[i][j]),我引入了一个代理类row_view(和const_row_view,但我并不关心这里的constness),它保留了一个指向开头的指针并且结束了。

我还希望能够分别遍历行和行内的元素:

matrix<double> m;
// fill m
for (row_view row : m) {
    for (double& elem : row) {
        // do something with elem
    }
}

现在,matrix<T>::iterator类(用于遍历行)在内部保持私有row_view rv;以跟踪迭代器指向的行。当然,iterator也实现了解除引用功能:

  • 对于operator*(),人们通常会想要返回引用。相反,这里正确的事情似乎是按值返回row_view(即返回私有row_view的副本)。这确保了当迭代器前进时,row_view仍然指向前一行。 (在某种程度上,row_view就像参考一样。)
  • operator->(),我不太确定。我看到两个选择:

    1. 返回指向迭代器的私有row_view的指针:

      row_view* operator->() const { return &rv; }
      
    2. 返回指向新row_view的指针(私有的副本)。由于存储生命周期,必须在堆上分配。为了确保清理,我将其包装在unique_ptr

      std::unique_ptr<row_view> operator->() const {
          return std::unique_ptr<row_view>(new row_view(rv));
      }
      
显然,2更正确。如果在调用 operator->之后迭代器是高级,则1中指向的row_view将更改。但是,我能想到这个问题的唯一方法是,如果operator->被其全名调用并且返回的指针被绑定了:

matrix<double>::iterator it = m.begin();
row_view* row_ptr = it.operator->();
// row_ptr points to view to first row
++it;
// in version 1: row_ptr points to second row (unintended)
// in version 2: row_ptr still points to first row (intended)

但是,这不是您通常使用operator->的方式。在这种用例中,您可能会调用operator*并保留对第一行的引用。通常,人们会立即使用指针调用row_view的成员函数或访问成员,例如it->sum()

我现在的问题是:鉴于->语法建议立即使用,operator->返回的指针的有效性被认为仅限于该情况,或安全上述“滥用”的实施帐户?

显然,解决方案2更昂贵,因为它需要堆分配。这当然是非常不受欢迎的,因为解除引用是一项非常常见的任务,并且实际上并不需要它:使用operator*来避免这些问题,因为它返回了row_view的堆栈分配副本。

1 个答案:

答案 0 :(得分:3)

如您所知,operator->以递归方式应用于函数返回类型,直到遇到原始指针。唯一的例外是,在代码示例中按名称调用它。

您可以使用它,并返回自定义代理对象。为了避免上一个代码段中的场景,该对象需要满足几个要求:

  1. 其类型名称应为matrix<>::iterator的私有,因此外部代码无法引用它。

  2. 其构造/复制/作业应该是私人的。 matrix<>::iterator将成为朋友,可以访问这些人。

  3. 实现看起来有点像这样:

    template <...>
    class matrix<...>::iterator {
    private:
      class row_proxy {
        row_view *rv_;
        friend class iterator;
        row_proxy(row_view *rv) : rv_(rv) {}
        row_proxy(row_proxy const&) = default;
        row_proxy& operator=(row_proxy const&) = default;
      public:
        row_view* operator->() { return rv_; }
      };
    public:
      row_proxy operator->() {
        row_proxy ret(/*some row view*/);
        return ret;
      }
    };
    

    operator->的实现返回一个命名对象,以避免由于C ++ 17中保证的副本省略而导致的任何漏洞。使用内联运算符(it->mem)的代码将像以前一样工作。但是,任何尝试按名称调用operator->()而不丢弃返回值的尝试都不会编译。

    Live Example

    struct data {
        int a;
        int b;
    } stat;
    
    class iterator {
        private:
          class proxy {
            data *d_;
            friend class iterator;
            proxy(data *d) : d_(d) {}
            proxy(proxy const&) = default;
            proxy& operator=(proxy const&) = default;
          public:
            data* operator->() { return d_; }
          };
        public:
          proxy operator->() {
            proxy ret(&stat);
            return ret;
          }
    };
    
    
    int main()
    {
      iterator i;
      i->a = 3;
    
      // All the following will not compile
      // iterator::proxy p = i.operator->();
      // auto p = i.operator->();
      // auto p{i.operator->()};
    }
    

    在进一步审查我建议的解决方案后,我意识到它并不像我想象的那么简单。无法在iterator范围之外创建代理类的对象,但仍然可以绑定对它的引用:

    auto &&r = i.operator->();
    auto *d  = r.operator->();
    

    因此允许再次申请operator->()

    立即解决方案是限定代理对象的运算符,并使其仅适用于rvalues。就像我的现场例子一样:

    data* operator->() && { return d_; }
    

    这将导致上面的两行再次发出错误,而正确使用迭代器仍然有效。不幸的是,由于铸造的可用性,这仍然无法保护API免受滥用,主要是:

    auto &&r = i.operator->();
    auto *d  = std::move(r).operator->();
    

    这是对整个努力的致命打击。没有阻止这一点。

    总而言之,对迭代器对象的operator->方向调用没有任何保护。最多,我们只能使API难以正确使用,而正确的用法仍然很容易。

    如果row_view副本的创建是广泛的,这可能已经足够了。但那是你要考虑的。

    我还没有在这个答案中提到的另一个需要考虑的问题是代理可以用来实现写入时的复制。但是在我的回答中,这个类可能和代理一样容易受到攻击,除非非常谨慎并且使用相当保守的设计。