还是我要测量其他东西?
在这段代码中,我有一堆标签(integers
)。每个标签都有一个字符串表示形式(const char*
或std::string_view
)。
在循环中,堆栈值将转换为相应的字符串值。这些值将附加到预分配的字符串或分配给数组元素。
结果表明,带有std::string_view
的版本比带有const char*
的版本要快。
代码:
#include <array>
#include <iostream>
#include <chrono>
#include <stack>
#include <string_view>
using namespace std;
int main()
{
enum Tag : int { TAG_A, TAG_B, TAG_C, TAG_D, TAG_E, TAG_F };
constexpr const char* tag_value[] =
{ "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };
constexpr std::string_view tag_values[] =
{ "AAA", "BBB", "CCC", "DDD", "EEE", "FFF" };
const size_t iterations = 10000;
std::stack<Tag> stack_tag;
std::string out;
std::chrono::steady_clock::time_point begin;
std::chrono::steady_clock::time_point end;
auto prepareForBecnhmark = [&stack_tag, &out](){
for(size_t i=0; i<iterations; i++)
stack_tag.push(static_cast<Tag>(i%6));
out.clear();
out.reserve(iterations*10);
};
// Append to string
prepareForBecnhmark();
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
out.append(tag_value[stack_tag.top()]);
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << out[100] << "append string const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
prepareForBecnhmark();
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
out.append(tag_values[stack_tag.top()]);
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << out[100] << "append string string_view= " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
// Add to array
prepareForBecnhmark();
std::array<const char*, iterations> cca;
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
cca[i] = tag_value[stack_tag.top()];
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << "fill array const char* = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
prepareForBecnhmark();
std::array<std::string_view, iterations> ccsv;
begin = std::chrono::steady_clock::now();
for(size_t i=0; i<iterations; i++) {
ccsv[i] = tag_values[stack_tag.top()];
stack_tag.pop();
}
end = std::chrono::steady_clock::now();
std::cout << "fill array string_view = " << std::chrono::duration_cast<std::chrono::microseconds>(end - begin).count() << "[µs]" << std::endl;
std::cout << ccsv[ccsv.size()-1] << cca[cca.size()-1] << std::endl;
return 0;
}
我的机器上的结果是:
Aappend string const char* = 97[µs]
Aappend string string_view= 72[µs]
fill array const char* = 35[µs]
fill array string_view = 18[µs]
Godbolt编译器资源管理器网址:https://godbolt.org/z/SMrevx
UPD::基准测试更加精确(500次运行300000次迭代)后的结果:
Caverage append string const char* = 2636[µs]
Caverage append string string_view= 2096[µs]
average fill array const char* = 526[µs]
average fill array string_view = 568[µs]
Godbolt网址:https://godbolt.org/z/aU7zL_
因此,在第二种情况下,const char*
比预期的要快。答案中解释了第一种情况。
答案 0 :(得分:10)
这是因为使用std::string_view
传递了长度,并且不需要在需要新字符串时插入空字符。 char*
每次都必须搜索 的结尾,如果您想要一个子字符串,则可能必须复制,因为在子字符串的结尾需要一个空字符。
答案 1 :(得分:4)
std::string_view
可以归结为:
{
const char* __data_;
size_t __size_;
}
该标准实际上以秒为单位。 24.4.2,这是一个指针和大小。它还指定某些操作如何与字符串视图一起使用。最值得注意的是,每当您与std::string
进行交互时,您都会调用重载,该重载也将大小作为输入。因此,当您调用append时,它可以归结为两个不同的调用:str.append(sv)
转换为str.append(sv.data(), sv.size())
。
主要区别在于,您现在知道append
之后的字符串的大小,这意味着您还知道是否需要重新分配内部缓冲器,以及它必须要多大。如果您不知道预先准备的大小,可以开始复制,但是std::string
为append
提供了强保证,因此出于实用目的,大多数库可能会预先计算长度和所需的缓冲区,尽管从技术上讲,如果您未成功完成操作,也可以记住旧大小并擦除所有内容(怀疑有人这样做,尽管这可能是字符串的局部优化,因为销毁是微不足道的)
答案 2 :(得分:3)
可能是由于string_view具有字符串值的大小。 “ const char *”没有有关大小的信息,必须对其进行定义。