52.2. TOAST

本節ではTOAST(過大属性格納技法:The Oversized-Attribute Storage Technique)の概要について説明します。

PostgreSQLは固定長のページサイズ(通常8キロバイト)を使用し、複数ページにまたがるタプルを許しません。 そのため、大規模なフィールド値を直接格納できません。 大規模なフィールド値を圧縮したり、複数の物理的な行に分割したりすることで、この限界はなくなりました。 これはユーザからは透過的に発生し、また、バックエンドのコード全体には小さな影響しか与えませんでした。 この技法はTOAST(または"パンをスライスして以来最善のもの")という愛称で呼ばれます。 [訳注:“パンをスライスして以来最善のもの(the best thing since sliced bread)”は素晴らしいものを意味します。]

一部のデータ型のみがTOASTをサポートします。 大規模なフィールド値を生成することがないデータ型にオーバーヘッドを負わせる必要はありません。 TOASTをサポートするためには、データ型は可変長(varlena)表現を持たなければなりません。 格納する値の最初の32ビットワードにはバイト単位の値の(このワード自体を含む)長さが含まれます。 TOASTは残りの表現について制限しません。 TOAST可能なデータ型をサポートするC言語関数は全て、TOAST化された入力値を注意して扱わなければなりません (通常これは、入力に対して何か作業をする前にPG_DETOAST_DATUMを呼び出すことで行われますが、もっと効率的な方法が可能な場合もあります)。

TOASTはvarlenaの長さワードの最上位2ビットを勝手に使用します。 そのため、全てのTOAST可能なデータ型の値の論理サイズは1ギガバイト(230 - 1バイト)までになります。 両ビットが0の場合、値はそのデータ型の普通のTOAST化されていない値となります。 どちらか片方のビットが設定された場合、値が圧縮されていることを意味し、使用前に伸長する必要があります。 もう片方のビットが設定された場合、値が行外に格納されていることを意味します。 この場合、値の残りは実際には単なるポインタとなり、データそのものはどこか他の場所に格納されます。 両方のビットが設定された場合は、行外のデータが圧縮されていることを意味します。 どのような場合でもvarlenaワードの下位ビットが示す長さは、伸長された、もしくは行外のデータを取り出した値の論理的サイズではなく、実際のdatumのサイズを表します。

テーブルの任意の列がTOAST可能な場合、そのテーブルは連携するTOASTテーブルを持ちます。 TOASTテーブルのOIDはテーブルのpg_class.reltoastrelid項目に格納されます。 詳細は後で説明しますが、行外のTOAST化された値はTOASTテーブル内に保持されます。

使用される圧縮技術は、LZ系の圧縮技術の1つで単純かつ非常に高速なものです。 詳細はsrc/backend/utils/adt/pg_lzcompress.cを参照してください。

行外の値は(圧縮される場合は圧縮後に)最大TOAST_MAX_CHUNK_SIZEバイトの塊に分割されます (この値はデフォルトでBLCKSZ/4より少し小さな値、または、およそ2000バイトです)。 各塊は、データを持つテーブルと連携するTOASTテーブル内に個別の行として格納されます。 全てのTOASTテーブルはchunk_id列(特定のTOAST化された値を識別するOID)、chunk_seq列(値の塊に対する連番)、chunk_data(塊の実際のデータ)列を持ちます。 chunk_idchunk_seqに対する一意性インデックスは値の抽出を高速化します。 したがって、行外のTOAST化された値を示すポインタdatumには、検索先となるTOASTテーブルのOIDと指定した値のOIDを格納しなければなりません。 簡便性のために、ポインタdatumには論理datumサイズ(元々の非圧縮のデータ長)と実際の格納サイズ(圧縮時には異なります)も格納されます。 varlenaヘッダワードに収納するためにTOASTポインタdatumの総サイズは、表現される値の実サイズに関係なく、20バイトになります。

TOASTのコードは、テーブル内に格納される値がBLCKSZ/4(通常2キロバイト)を超える時にのみ実行されます。 TOASTコードは、行の値がBLCKSZ/4より小さくなるかそれ以上の縮小ができなくなるまで、フィールド値の圧縮や行外への移動を行います。 更新操作中、通常変更されない値はそのまま残ります。 行外の値を持つ行の更新では、行外の値の変更がなければTOASTするコストはかかりません。

TOASTコードでは、以下のTOAST可能な列を格納するための4つの異なる戦略を認めます。

TOAST可能なデータ型はそれぞれ、そのデータ型の列用のデフォルトの戦略を指定します。 しかしALTER TABLE SET STORAGEを使用して、あるテーブル列の戦略を変更することができます。

この機構には、ページをまたがる行の値を許可するといった素直な手法に比べて多くの利点があります。 通常問い合わせは比較的小さなキー値に対する比較で条件付けされるものと仮定すると、エクゼキュータの仕事のほとんどは主だった行の項目を使用して行われることになります。 TOAST化属性の大規模な値は、(それが選択されている時)結果集合をクライアントに戻す時に引き出されるだけです。 このため、主テーブルは行外の格納を使用しない場合に比べて、かなり小さくなり、その行は共有バッファキャッシュにより合うようになります。 ソート集合もまた小さくなり、ソートが完全にメモリ内で行われる頻度が高くなります。 小規模な試験結果ですが、典型的なHTMLページとそのURLを持つテーブルでは、TOASTテーブルを含め、元々のデータサイズのおよそ半分で格納でき、さらに、主テーブルには全体のデータのおよそ10%のみ(URLと一部の小さなHTMLページ)が格納されました。 比較のために全てのHTMLページを7キロバイト程度に切り詰めたTOAST化しないテーブルと比べ、実行時に違いはありませんでした。