Postgresql 中文操作指南

F.46. tsm_system_rows — the SYSTEM_ROWS sampling method for TABLESAMPLE #

tsm_system_rows 模块提供表采样方法 SYSTEM_ROWS ,它可以在 SELECT 命令的 TABLESAMPLE 子句中使用。

此表采样方法接受一个单个整数参数,该参数是要读取的最大行数。除非表未包含足够行(在这种情况下将选择整个表),否则最终样本将总是包含恰好那么多行。

与内置 SYSTEM 采样方法类似,SYSTEM_ROWS 执行块级采样,因此样本不是完全随机的,但可能受群集效应影响,尤其是当仅请求少数行时。

SYSTEM_ROWS 不支持 REPEATABLE 子句。

此模块被认为是“受信任的”,也就是说,它可以由在当前数据库上具有 CREATE 权限的非超级用户安装。

F.46.1. Examples #

以下是如何使用 SYSTEM_ROWS 选择表的样本的示例。首先安装该扩展:

CREATE EXTENSION tsm_system_rows;

然后,你可以在 SELECT 命令中使用它,例如:

SELECT * FROM my_table TABLESAMPLE SYSTEM_ROWS(100);

此命令将从表 my_table 中返回 100 行样本(除非该表没有 100 行可见行,在这种情况下将返回其所有行)。