DB2面向OLTP环境的物理数据库设计:数据和索引压缩

您可以通过使用内置在 DB2 for Linux, UNIX and Windows 数据库中的压缩功能来减少表、索引和备份映像的大小,从而减少数据所需的存储量。 表和索引通常包含重复信息。这种重复可能是单独或合并的列值,也可能是列值的共同前缀,或者是在 XML 数据中的重复模式。压缩方法可以使用短字符串或符号来代替重复的信息。 您可以使用一些压缩功能来减少存储表和索引功能所需的空间,同时也可以采用一些功能来确定压缩可以提供的节省。您还可以使用备份压缩来减少备份的大小。 DB2 Version 9.7 的大多数版本中都包含的压缩功能包括:

 值压缩
 备份压缩

以下额外的压缩功能与 DB2 存储优化特性的许可是一起提供的:

 行压缩,包括 XML 存储对象的压缩
 临时表压缩
 压缩的暂时或永久表上的索引压缩

行压缩

行压缩,有时也被称为静态压缩,它用较短的符号字符串替换在各行中重复的值模式,从而压缩数据行。 使用行压缩的主要好处是,您可以在更小的空间中">存储数据,可以产生显著的存储成本节省。此外,因为您以较慢的速度使用存储,所以可以推迟额外存储空间的未来支出。 除了节省成本之外,行压缩还可以提高性能。对压缩数据的许多查询可以用更少的 I/O 操作来执行,因为每次从磁盘读取都会带来更多数据。同样,可以将更多数据缓存在缓冲池中,这会增加缓冲池命中率。然而,这里有一个权衡要考虑,数据压缩和解压需要使用额外的CPU周期。 一个表要为行压缩做好准备,有两个要求:

 您必须使用 COMPRESS YES 子句创建或修改一个表,使该表具有使用压缩功能的资格。
 您必须从将要压缩的表中建立一个值或符号的字典。根据您所使用的 DB2 数据库产品的版本,建立压缩字典的手段会有所不同。

在这两个要求得到满足后,就可以压缩在表中插入或更新的数据了。

以下是在表和索引中启用行压缩的一个简单示例:

CREATE TABLE T1 (C1 INT, C2 INT, C3 INT) COMPRESS YES
CREATE INDEX I1 ON T1(C1)
SELECT COMPRESSION FROM SYSCAT.INDEXES WHERE TABNAME=’T1’
COMPRESSION
-----------
Y
1 record(s) selected.

行压缩的良好候选者

检查您的数据库,确定数据库内的哪些表可能是压缩的候选者。最初,启用数据压缩是为了在现有的未压缩表上节省存储。稍后,数据压缩可以帮助您优化未来的存储增长。在数据库现有的表和/或预期随着时间的推移增长得更快的表中,可能会发现一些存储“难题”。

很明显,最大的表是行压缩的候选者,但千万不要忽视较小的表。如果您有数百或数千个较小的表,您可能会受益于压缩许多较小的表的聚合效果。大和小在这里是相对的。数据库的设计就决定着包含一百万或几百万个行的表是大还是小。

几百 KB 以下的小表不是良好的行压缩的候选者,因为可以实现的空间节省并不足以抵消数据压缩字典的存储需求。小表的字典大小约为 100 KB,存储在物理表数据对象中。作为一个经验法则,应该考虑压缩大小为 2 MB 或以上的小表。

只读表是非常好的压缩候选者。如果表中只有少量更新,那么该表可能是一个很好的候选者。如果某个表有大量的更新,那么该表可能不是压缩的良好候选者。读/写比例为 70/30 或更高的表是优秀的压缩候选者。 试图压缩这些表之前,先将大表分隔到它们自己的表空间中。

时间: 2014-12-19

DB2面向OLTP环境的物理数据库设计:数据和索引压缩的相关文章

DB2面向OLTP环境的物理数据库设计:数据库操作和维护

在数据库系统进入生产环境之后,工作重点会转向对数据库系统的日常维护.日常运营方面包括性能管理.问题诊断和维护,它们必须继续满足业务http://www.aliyun.com/zixun/aggregation/14189.html">服务水平协议. 面向 OLTP 环境的物理数据库设计应包括运营和维护任务的时间表.本节提供了此类活动的总结. 恢复策略 作为 RAS 整体策略的一部分,恢复策略在满足您的 RAS 目标中发挥着重要作用.虽然事实上在许多层次上都存在冗余,但在定义恢复点目标 (R

DB2面向OLTP环境的物理数据库设计:表空间和缓冲池

在设计表空间和物理设备上的容器位置时,我们的目标是最大限度地提高 I/O 的并行度,增加缓冲区利用率和缓冲池命中率.为了实现这一目标,您需要透彻了解数据库设计和应用程序. 了解表空间和缓冲池的工作原理以及它们影响数据库的整体性能的方式,这可以帮助您确定一些问题,例如,将两张表分隔到不同的设备是否会导致并行 I/O,或者是否应在一个单独的表空间中创建一个表,使该表可以被完全缓冲. 您的设计中要考虑的两个主要存储领域是: 1. 表空间.表空间的类型和设计可以决定对该表空间所执行的 I/O 效率. 2

DB2面向OLTP环境的物理数据库设计:查询设计

在最基本的层面,包括选择.插入.更新和删除在内的 SQL 操作是应用程序与 DB2 数据库进行交互的方式.应用程序的总体性能和体验受到该应用程序所用的 SQL 操作的影响. 设计.维护.监视和调优 SQL 查询的完整处理超出了本文的范围.然而,我们从较高层次概述了查询设计的工具和一般准则,因为查询设计和物理数据库设计彼此密切相关. 大多数物理数据库设计的特征对 SQL 语句并不明显,但为了更好地使用 DB2 特性,在编写查询时需要考虑到数据库的物理特征,如索引.例如,使用范围分区表时,选择查询即

DB2面向OLTP环境的物理数据库设计:数据库事务日志

数据库事务日志对于数据库恢复至关重要,也是设计高度可用的数据库解决方案的一个重要组成部分. 数据库日志使得从故障中恢复成为可能.它们还可以在 HADR 环境中同步主数据库和备用数据库. DB2 对每个数据库使用一组独立的日志文件. 所有数据库都有与自己有关联的日志.这些日志保留数据库变更的记录.如果数据库需要还原到最后一次完整离线备份之前的某个点,日志需要将数据前滚到故障点.DB2 数据库支持两种类型的数据库的日志:循环日志和归档日志. 循环日志 循环日志仅支持崩溃恢复,也就是说,如果 DB2

DB2面向OLTP环境的物理数据库设计:数据建模

收集需求并创建逻辑模型,这是良好的物理数据库设计的关键. 数据建模的第一步是收集需求.该步骤涉及识别需要维护的关键业务工件.数据和信息.这些业务工件被称为实体.对于http://www.aliyun.com/zixun/aggregation/7976.html">在线购物目录,有关客户.产品和定价的信息都是业务关键信息,即实体. 可以通过利益相关者的输入来收集需求.需求和数据模型通过迭代方式向对方输送数据而得到进一步完善,从而创建一个逻辑模型. 图 1 显示了迭代数据建模范例: 收集需求

DB2面向OLTP环境的物理数据库设计:表

DB2 数据库将数据存储在表中.有几种类型的表可以存储永久性数据,如多维集群表.分区表和范围集群表.除了用于存储永久性数据的表之外,也有一些表可用来展示结果.汇总表.临时表. 根据数据的显示形式和事务类型,您可能会找到一个表类型,提供可以为您的环境优化存储和查询性能的特定功能. 选择合适的表类型 表类型的选择取决于业务和应用程序的需求.表中存储的数据的性质和查询的性能要求.下节描述了每种表类型适合在何时使用. 基表 基表可以保存永久性数据.DB2 数据库的基表有以下几种类型: 常规表 有索引的常

DB2面向OLTP环境的物理数据库设计:数据类型

为一个数据库设计表,这涉及到选择一个合适的http://www.aliyun.com/zixun/aggregation/14208.html">数据模型和数据类型.数据类型是一个列属性定义,它指示了应该将什么类型的数据存储在一个表列中. 根据所存储的数据的性质小心选择正确的数据类型,这有助于最大限度地减少存储需求. 最大限度地减少数据行消耗的空间,这有助于将更多行放在一个数据页面中.如果一个数据页面中有更多的行,那么这样可以提高缓冲池命中率,减少 I/O 成本,并实现更好的查询性能.DB

DB2面向OLTP环境的物理数据库设计:索引

在 DB2 数据库中,索引是按一个或多个键的值进行逻辑排序的一组指针.指针可以引用表中的行.MDC 表中的块,或在 XML 存储对象中的 XML 数据. 索引通常用于加快对表中的行的访问.若在表上定义了良好的索引,查询就可以更快地访问行. 索引是数据库对象.它们是物理对象,而不是逻辑对象(如,视图).因此,索引也占用http://www.aliyun.com/zixun/aggregation/17325.html">存储空间,需要那些会占用系统资源的必要维护.一组精心设计的索引可以提高

DB2面向OLTP环境的物理数据库设计:可靠性、可用性和可伸缩性

为了跟上如今全球化程度不断增加且日益竞争激烈的市场,您的http://www.aliyun.com/zixun/aggregation/10145.html">企业架构必须有足够的灵活性,能够随着未来战略性需求的变化而一起成长,并在计划内和计划外停机中确保业务连续性. 对于任务关键型的 24x7 企业,一个小时的停机时间可以转化为数百万美元的收入损失,更不用说商业信誉的损害和潜在的客户流失.全球化企业都是跨时区运营的,提供全天候的业务服务.系统维护和升级的定期维护窗口已不复存在.分布式企业