Question

有什么方法可以获取加载到vespa的所有文档？

我尝试使用正则表达式查询，但是没有按预期工作。

select * from entity where ID matches "[.]+";

ID不是属性，但是我尝试了一个属性字段，两者均未响应任何值。

Answer 1

通常最好使用vespa-visit工具或使用visiting in the document/v1 REST API来访问而不是搜索。

如果要使用搜索，请使用此查询来匹配所有类型的文档：

select * from yourdocumenttype where sddocname contains 'yourdocumenttype';

要以此遍历所有文档，使用文档中的某个字段将文档集划分为较小的块并一次查询一个块会更有效（例如，如果您有时间戳字段，请添加查询的范围条件，以在每次查询中检索文档一段时间。

（仅在流模式下支持正则表达式。）

Answer 2

要从Vespa转储所有文档，请使用vespa-visit：

“访问”是与搜索界面不同的界面-它是为具有高吞吐量但不一定具有低延迟的大型数据传输而构建的

使用visit提取完整的转储或子集。