Postgresql 中文操作指南
F.46. tsm_system_rows — the SYSTEM_ROWS sampling method for TABLESAMPLE #
tsm_system_rows 模块提供表采样方法 SYSTEM_ROWS ,它可以在 SELECT 命令的 TABLESAMPLE 子句中使用。
此表采样方法接受一个单个整数参数,该参数是要读取的最大行数。除非表未包含足够行(在这种情况下将选择整个表),否则最终样本将总是包含恰好那么多行。
与内置 SYSTEM 采样方法类似,SYSTEM_ROWS 执行块级采样,因此样本不是完全随机的,但可能受群集效应影响,尤其是当仅请求少数行时。
SYSTEM_ROWS 不支持 REPEATABLE 子句。
此模块被认为是“受信任的”,也就是说,它可以由在当前数据库上具有 CREATE 权限的非超级用户安装。
F.46.1. Examples #
以下是如何使用 SYSTEM_ROWS 选择表的样本的示例。首先安装该扩展:
CREATE EXTENSION tsm_system_rows;
然后,你可以在 SELECT 命令中使用它,例如:
SELECT * FROM my_table TABLESAMPLE SYSTEM_ROWS(100);
此命令将从表 my_table 中返回 100 行样本(除非该表没有 100 行可见行,在这种情况下将返回其所有行)。