pg

大家好!我是只谈技术不剪发的 Tony 老师。

PostgreSQL 全球开发组于 2021-05-20 发布了 PostgreSQL 14 的第一个 beta 版本,目前已经提供了下载。虽然细节可能会有所改变,但是该版本包含了 PostgreSQL 14 最终正式版中所有新特性的预览,让我们赶紧一睹为快吧!

性能增强

PostgreSQL 14 继续了最近几个版本对各种负载情况下的性能优化。该版本针对大量数据库连接时的事务吞吐量有了极大的改进,无论事务处于活动还是空闲状态。

PostgreSQL 14 进一步减少了 B-树索引的资源消耗,包括频繁更新索引导致的表膨胀GiST 索引可以在构建过程中预先排序数据,能够更快地创建索引并减少索引大小。SP-GiST 索引支持覆盖索引,可以使用 INCLUDE 子句为索引增加不可搜索的额外字段。

PostgreSQL 14 增加了许多并行查询功能。除了对并行顺序扫描的整体性能提升之外,PL/pgSQL 中的 RETURN QUERY 指定现在可以并行执行,REFRESH MATERIALIZED VIEW 命令也可以使用并行查询。

PostgreSQL 14 还增加了使用 FDW 查询远程数据库时的并行执行功能。对于 PostgreSQL 外部数据封装器 postgres_fdw,当设置了 async_capable 标识时可以使用并行查询。postgres_fdw 还支持批量插入,使用 IMPORT FOREIGN SCHEMA 命令导入表分区,以及外部表上的 TRUNCATE 命令。

该版本还改进了分区系统,包括更新或删除数据行影响很少分区时的性能提升。PostgreSQL 14 可以使用 ALTER TABLE … DETACH PARTITION … CONCURRENTLY 命令以非阻塞的方式卸载分区。

上个版本引入的增量排序功能在 PostgreSQL 14 中可以用于窗口函数。该版本增强了扩展统计的范围,可以支持表达式的扩展统计。

几十年来,PostgreSQL 一直支持“超大字段”的压缩存储TOAST 技术),新版本增加了使用 LZ4 算法压缩字段的功能。

数据类型和 SQL

PostgreSQL 14 基于已有的 range 类型支持增加了新的 multirange 类型,允许用户定义非连续范围的有序列表,例如:

SELECT datemultirange( daterange('2021-07-01', '2021-07-31'), daterange('2021-09-01', '2021-09-30'), daterange('2021-11-01', '2021-11-30'), daterange('2022-01-01', '2022-01-31'), daterange('2022-03-01', '2022-04-07') );
datemultirange                                                                                                           |
-------------------------------------------------------------------------------------------------------------------------+
{[2021-07-01,2021-07-31),[2021-09-01,2021-09-30),[2021-11-01,2021-11-30),[2022-01-01,2022-01-31),[2022-03-01,2022-04-07)}|

新的 multirange 类型支持所有和 range 类型相关的操作。

PostgreSQL 14 为嵌套对象增加了一个新的通用下标访问方法。例如,用户可以使用以下下标访问的方法获取 JSONB 数据中的元素:

SELECT ('{ "this": { "now": { "works": "in postgres 14!" }}}'::jsonb)['this']['now']['works'];
jsonb            |
-----------------+
"in postgres 14!"|

PostgreSQL 14 支持存储过程的 OUT 参数,以及允许在 GROUP BY 子句中使用 DISTINCT 关键字删除 GROUPING SET 组合中的重复分组。

对于通用表表达式(WITH 子句),PostgreSQL 14 增加了 SEARCHCYCLE 选项,分别用于指定搜索顺序和循环检测。

PostgreSQL 14 还增加了新的 date_bin 函数, 可以用于将时间戳按照指定的间隔进行对齐(一种称为“装箱”的技术)。例如:

SELECT date_bin('15 minutes', TIMESTAMP '2020-02-11 15:44:17', TIMESTAMP '2001-01-01');
date_bin           |
-------------------+
2020-02-11 15:30:00|

SELECT date_bin('15 minutes', TIMESTAMP '2020-02-11 15:44:17', TIMESTAMP '2001-01-01 00:02:30');
date_bin           |
-------------------+
2020-02-11 15:32:30|

管理功能

PostgreSQL 14 针对 VACUUM 命令进行了许多改进,包括索引的优化。Autovacuum 现在可以分析分区表,并且能够将数据行的统计信息关联到父表。另外,通过调整 maintenance_io_concurrency 参数可以改善 ANALYZE 命令的性能。that can be controlled with parameter.

PostgreSQL 14 增强了信息的监控能力,包括使用 pg_stat_progress_copy 视图跟踪 COPY 命令的进度。该版本提供了监控 WAL 信息的 pg_stat_wal 视图,以及查看复制插槽统计信息的 pg_stat_replication_slots 视图。

PostgreSQL 14 增加了连接管理相关的几个参数,包括 idle_session_timeout(设置关闭空闲连接的等待时间)以及 client_connection_check_interval (允许 PostgreSQL 在客户端断开后取消长时间运行的查询)。

REINDEX 命令现在支持分区表的子索引,同时 PostgreSQL 14 增加了一个新的使用工具 pg_amcheck ,用于检查数据损坏。

复制和恢复

PostgreSQL 14 增强了逻辑复制的各种性能,包括将正在进行中的事务传输到订阅服务器的能力,而不需要等待事务完成。The ALTER SUBSCRIPTION 使得增加/删除订阅更加简单。

PostgreSQL 14 改善了 PostgreSQL 从故障恢复状态中启动的速度,同时还支持针对 standby 模式下的 PostgreSQL 实例使用 pg_rewind 命令同步数据。

安全增强

PostgreSQL 14 提供了两个预定义的角色:pg_read_all_data 和 pg_write_all_data,它们分别可以用于为用户指定全局“只读” 和“只写”权限。

该版本对于新的 PostgreSQL 实例默认使用 SCRAM-SHA-256 算法管理密码。另外,pg_hba.conf 配置文件中的 clientcert 参数现在必须指定为 verify-ca 或者 verify-full,而不能是以前的数值。

从 PostgreSQL 14 开始,pg_hba.conf 配置文件中的 clientname 可以设置为 DN,表示使用证书的专有名称进行基于证书的身份认证

更多特性

除了以上内容,PostgreSQL 14 还增加了大量的新功能和改进,完整的新特性列表可以参考官方的发行说明

我们会在后续文章中针对这些新特性具体进行介绍和分析,欢迎关注❤️、评论📝、点赞👍!

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐