Question

我有一些辅助代码，这些辅助代码使用编译时索引来执行向量重排。最重要的是，生成的代码应尽可能高效。我依赖带有折叠表达式的参数包，我想知道编写此类代码的最佳实践是什么。

一个实际示例：让函数insert将容器y的元素插入到容器x的位置Ii处，这些位置是编译时常量。此功能的基本签名如下所示：

template<size_t... Ii, size_t Xsize, size_t Size>
constexpr container<Xsize> insert(container<Xsize> x, container<Ysize> y);

其调用方式如下：insert<0, 2>(x, y)。我看到实现此目标的两种明显可能性。

首先：使用辅助索引变量遍历y：

template<size_t... Ii, size_t Xsize, size_t Size>
constexpr container<Xsize> insert(container<Xsize> x, container<Ysize> y) {
  int i = 0;
  ((x[Ii] = y[i++]), ...);
  return x;
}

此解决方案的问题是变量i：我必须依靠编译器对其进行优化。

第二种解决方案避免了任何运行时依赖关系，但是它需要一个辅助功能，这使得整个实现都很难看：

template<size_t... Ii, size_t... Yi, size_t Xsize, size_t Size>
constexpr container<Xsize> insert_(container<Xsize> x, container<Ysize> y, std::index_sequence<Yi...>) {
  ((x[Ii] = y[Yi]), ...);
  return x;
}

template<size_t... Ii, size_t Xsize, size_t Size>
constexpr container<Xsize> insert(container<Xsize> x, container<Ysize> y) {
  return insert_<Ii...>(x,y, std::make_index_sequence<sizeof...(Ii)> {});
}

有没有一种方法可以避免运行时变量和辅助函数的完成？

Answer 1

生成的代码尽可能高效是至关重要的。

关于示例，请注意：您应确保性能不会因按值传递函数参数而受到影响。返回值也一样。

有没有一种方法可以避免运行时变量和辅助函数的完成？

您可以实现可重用的帮助器功能。例如，请考虑以下代码。

static_assert(__cplusplus >= 201703L, "example written for C++17 or later");

#include <cstddef>

#include <array>
#include <type_traits>
#include <utility>

namespace detail {

template<std::size_t... inds, class F>
constexpr void gen_inds_impl(std::index_sequence<inds...>, F&& f) {
  f(std::integral_constant<std::size_t, inds>{}...);
}

}// detail

template<std::size_t N, class F>
constexpr void gen_inds(F&& f) {
  detail::gen_inds_impl(std::make_index_sequence<N>{}, std::forward<F>(f));
}

// the code above is reusable

template<
  std::size_t... inds_out,
  class T, std::size_t size_out, std::size_t size_in
>
constexpr std::array<T, size_out> insert1(
  std::array<T, size_out> out,
  std::array<T, size_in> in
) {
  static_assert((... && (inds_out < size_out)));
  static_assert(sizeof...(inds_out) <= size_in);

  gen_inds<sizeof...(inds_out)>([&] (auto... inds_in) {
    ((out[inds_out] = in[inds_in]), ...);
  });

  return out;
}

一种类似的替代方法是static_for方法：

static_assert(__cplusplus >= 201703L, "example written for C++17 or later");

#include <cstddef>

#include <array>
#include <type_traits>
#include <utility>

namespace detail {

template<std::size_t... inds, class F>
constexpr void static_for_impl(std::index_sequence<inds...>, F&& f) {
  (f(std::integral_constant<std::size_t, inds>{}), ...);
}

}// detail

template<std::size_t N, class F>
constexpr void static_for(F&& f) {
  detail::static_for_impl(std::make_index_sequence<N>{}, std::forward<F>(f));
}

// the code above is reusable

template<
  std::size_t... inds_out,
  class T, std::size_t size_out, std::size_t size_in
>
constexpr std::array<T, size_out> insert2(
  std::array<T, size_out> out,
  std::array<T, size_in> in
) {
  static_assert(sizeof...(inds_out) >= 1);

  static_assert((... && (inds_out < size_out)));
  static_assert(sizeof...(inds_out) <= size_in);

  constexpr std::size_t N = sizeof...(inds_out);

  static_for<N>([&] (auto n) {
    // note the constexpr
    constexpr std::size_t ind_out = std::array{inds_out...}[n];
    constexpr std::size_t ind_in = n;
    out[ind_out] = in[ind_in];
  });

  return out;
}

Answer 2

我认为这样做既不可能避免运行时变量又不能避免使用辅助功能（希望有人可以证明这一点）。

我非常喜欢您的第二个解决方案，但是...对于y使用迭代器会怎么样（如果y支持cbegin()和迭代器，显然）。

类似（警告：代码未经测试）

template <std::size_t Ii...., std::size_t Xsize, std::size_t Ysize>
constexpr container<Xsize> insert(container<Xsize> x, container<Ysize> const & y) {
   auto it = y.cbegin();
   ((x[Ii] = *it++), ...);
   return x;
}

这几乎是您的第一个解决方案，但是对y递增迭代器的访问（我想对于某些容器来说是顺序遍历）应该比使用operator[]()更有效率（效率更高）。

但是我还假设，有了一个好的优化程序，就没有明显的区别。

枚举折叠表达式

2 个答案: